L'innovazione nel territorio

GeosmartMagazine

L'innovazione nel territorio

Theuth

- Startupeasy

Theuth Linguistic Engines Srl è uno spin-off accademico composto da professori e ricercatori del Dipartimento di Scienze Politiche e della Comunicazione dell’Università degli studi di Salerno. Lo spin-off è nato dopo anni di collaborazioni con il mondo dell’impresa da parte del suo gruppo fondatore. Lo spin off , grazie ad una forte spinta imprenditoriale, è passato da una ricerca di base in linguistica computazionale e data visualization ad una ricerca applicata rivolta al mercato. Dal nome, che mette in campo l’antico nome del dio egiziano del linguaggio, si può evincere che l’obiettivo principale è quello di diventare una realtà aziendale di eccellenza nello sviluppo di soluzioni software, lingware e di consulenza nell’ambito del linguaggio naturale.
Theuth Linguistic Engines Srl basa la sua attività sull’Intelligenza Artificiale e su motori linguistici in senso lato, cioè morfologici, sintattici, lessicali e semantici. Si tratta di diversi strumenti linguistici che hanno la funzione di accelerare e/o migliorare la realizzazione di prodotti nei più svariati campi dell’Intelligenza Artificiale, del Natural Language Processing, del Chatbot/Virtual Assistant e delle applicazioni che mettono insieme immagini e parole. In particolare, lo spin-off fornisce servizi di sentiment analysis e opinion mining per Enti ed aziende su tutto il territorio nazionale.

Concorrenza

Le principali analisi automatiche di valutazione dell’ultimo decennio utilizzano programmi e applicazioni standard, che non sempre si dimostrano validi per un’analisi a grana fine su data base complessi e di grandi dimensioni. La complessità delle basi di dati testuali, soprattutto se estratti dai social, richiede una preliminare catalogazione dei post e la riconversione di emoji, hashtag, acronimi, ecc., quando si devono utilizzare software ad hoc, costruiti caso per caso. Si ricorre, in queste tipologie di analisi, a set semi automatici di acquisizione e formazione delle basi di dati e si operano ulteriori azioni di classificazione, raggruppamento e controllo, prima dell’elaborazione automatica vera e propria. In alcuni casi i dati devono essere etichettati a mano e il loro trattamento richiede etichettatori esperti nel dominio dell’applicazione, i quali, in quanto specialisti del settore di analisi, sapranno valutare le mutevoli esigenze operative, in ragione delle richieste dell’analisi proposte, utilizzando set di formazione adeguati. Il metodo Theuth propone una visione integrata, idonea a creare un modello che porta al risultato atteso attraverso azioni di codifica del data base e tramite processi di classificazione e analisi, che riesaminano sia gli elementi di criticità e potenzialità sia gli elementi linguistici, emotivi e sociali. La metodologia proposta si basa su una pipeline di elaborazione del linguaggio naturale completamente automatica. Gli output possono essere report e/o dashboard interattive in grado di esplorare i valori delle analisi su ogni tipo di testo e di offrirne una sintesi. L’approccio qualitativo e quantitativo insieme richiede una fattiva collaborazione interdisciplinare tra linguistica computazionale e design, volendo avvalersi delle tecniche di progettazione e visualizzazione dei risultati dell’osservazione ottenuti automaticamente. Il pre-processo riguarda gli strumenti e le tecniche di raccolta e classificazione dei dati, mentre l’elaborazione vera e propria consiste nel trattamento di riclassificazione, finalizzato all’utilizzo dei dati con algoritmi specifici di sentiment analysis, emotion detection e topic modeling.
Settore: IT
Labels: FormazioneDigitale, INFORMATICA, SocialNetwork
Canali di Vendita: Directly, E-commerce
Interessi: Business partners, Customers, Incubator / Coworking spaces, Lender / Investor, Partner university

Stadio della startup Theuth

Prodotto/Servizio

ANALISI DEL SENTIMENT SUI SOCIAL – IL METODO THEUTH Per l’analisi delle comunicazioni sui social (facebook, twitter, instagram), trattiamo dati strutturati (inseriti in box) e non strutturati (per es. testi liberi), ponendo particolare attenzione alle metriche di interazione, positive e negative, da cui si evincono le performance. I contenuti sono processati nella loro interezza (immagini, testi, emoji ed hashtag), al fine di effettuare misurazioni di polarità (sentiment), individuare macrotemi (campi semantici di interesse) e dedurre una classificazione delle emozioni. Dall’intersezione di queste tipologie di trattamenti, si giunge alla definizione di due viste sul fenomeno, che vanno da un piano quantitativo, in cui si descrivono le tematiche più trattate e più performanti, a un piano qualitativo, in cui si evincono i toni di voce tradotti in emozioni e si delinea una gerarchia di quest’ultime in base ai temi individuati. Per ciascuna di queste rilevazioni di tipo linguistico, si effettua una misurazione di performance. Il fine è di fotografare il risultato delle performance di chi si rende visibile sul web, ma anche di suggerire strategie più efficaci sul piano espressivo e contenutistico, con la possibilità di adottare questo tipo di rilevazione per la progettazione di campagne data driven. L’aspetto innovativo del lavoro è dato dalla elaborazione tramite procedure di Natural Language Processing (NLP) di tutte le funzionalità che contribuiscono a comporre i post nei social network. Le caratteristiche verbali (ovvero la didascalia, i testi scritti inseriti nelle immagini e gli hashtag), e quelle non verbali come le immagini (foto di Instagram ed emoji) vengono trattate automaticamente. Una volta applicate le tecniche di sentiment analysis, emotion detection e topic modeling, tutte le informazioni che compongono il dataset vengono automaticamente messe in relazione tra loro e visualizzate in una dashboard interattiva, che consente l’osservazione del fenomeno sotto diverse prospettive, attraverso un sistema di filtri, zoom e interazioni interdipendenti tra le diverse visualizzazioni. Ogni punteggio raggiunto dai tre linguaggi presi in considerazione (testo libero, hashtag, emoji) viene ponderato in base al presupposto che il livello di euforia delle emoji sia superiore a quello degli hashtag.

Team

Dati della startup Theuth

Costituzione Impresa : 22/10/2020
Data iscrizione alla sezione delle Startup: 25/11/2020
Denominazione:
THEUTH LINGUISTIC ENGINES SRL SOCIETA' IN LIQUIDAZIONE
Comune: SALERNO
Provincia: Salerno
Regione: Campania
Codice Fiscale: 05947460654
Forma Giuridica : SOCIETA' A RESPONSABILITA' LIMITATA
Codice Ateco : 6202
Settore: IT

Theuth

Modello di Business

Il modello di business inziale è quello dell’erogazione di servizi informatici per la valutazione del sentiment (opinione) presente sui social (twitter, instagram, facebook) sulla base di tools e strumenti di linguistica computazionale di proprietà della società. Non forniamo un prodotto che il cliente deve utilizzare da solo, ma un servizio basato sulla ricerca dei dati a cura della società e successivamente elaborando report e infografiche per il cliente. Il metodo utilizzato è interamente scalabile e quindi il valore è prodotto dalle diverse applicazioni che usufruiscono della stessa tecnologia e del lavoro dei soci per generare i report e le infografiche.

Innovazione

Breve descrizione degli aspetti di innovazione che caratterizzano il business dell’impresa Oggi la comunicazione con i clienti e i cittadini rende necessario un approccio multicanale in grado di soddisfare un pubblico digitale molto evoluto, qualificato ed esigente, che richiede la massima flessibilità per portare avanti le proprie attività senza alcuna interruzione. I nostri strumenti di comprensione del linguaggio naturale offrono tutta l’accuratezza, la velocità e la flessibilità necessarie per rispondere ai problemi e ai quesiti dei clienti, garantendo la possibilità di stabilire un contatto in ogni momento e con qualsiasi dispositivo. Diverse sono le funzionalità degli strumenti: • Compatibilità con qualsiasi base di conoscenza, strutturata e non strutturata • Facilità di integrazione con software di riconoscimento vocale e sistemi già in uso • Integrazione con repository di terze parti, tra cui Facebook, Messenger, Telegram, Skype, Cisco Webex, Alexa, Google Assistant e Whatsapp • Possibilità di configurare il passaggio da chatbot a un operatore umano Dal punto di vista tecnologico le nostre soluzioni cercano di sfruttare una rappresentazione della conoscenza ampia e generica che integri i migliori strumenti di comprensione del linguaggio naturale (NLU, Natural Language Understanding) e di machine learning (ML) per automatizzare in modo intelligente i processi di business ed estrarre informazioni strategiche dalle fonti a disposizione. In buona sostanza noi ricorriamo a motori linguistici che offrono una soluzione completa per la gestione dell’informazione non strutturata, che comprendono la lingua in un modo analogo a quanto fanno gli esseri umani, perché catturano tutti gli aspetti strutturali e lessicali del testo per comprenderne il significato.

Requisiti di innovazione tecnologica

R&S

Team Qualificato

Proprietà Intellettuale

classe di produzione
1-100K euro
A

Leggenda Classe di Produzione
A=1-100K euro
B=100K-500K euro
C=500K-1M euro
D=1M-2M euro
E=2M-5M euro
F=5M-10M euro
G=10M-50M euro
H=più di 5OM di euro
ND=non disponibile

Leggenda Classe di Addetti
A=0-4 addetti
B=5-9 addetti
C=10-19 addetti
D=20-49 addetti
E=50-249 addetti
F=almeno 250 addetti
ND=non disponibile

classe di capitale
5K-10K euro
3

Leggenda Classe di Capitale
1=1 euro
2=1-5K euro
3-5K-10K euro
4=10K-50K euro
5=50K-100K euro
6=100K-250K euro
7=250K-500K euro
8=500K-1M euro
9=1M-2,5M euro
10=2,5M-5M euro
11=più di 5M di euro
ND=non disponibile

prevalenza femminile
NO

Legenda prevalenza femminile/giovanile/straniera
NO: [% del capitale sociale + % Amministratori] / 2 ≤ 50%
Maggioritaria: [% del capitale sociale + % Amministratori] / 2 > 50%
Forte: [% del capitale sociale + % Amministratoril / 2 > 66%
Esclusiva: [% del capitale sociale + % Amministratori] / 2 = 100%
?: Non disponibile

I dati sulla prevalenza sono riferiti al trimestre precedente

prevalenza giovanile
NO

Legenda prevalenza femminile/giovanile/straniera
NO: [% del capitale sociale + % Amministratori] / 2 ≤ 50%
Maggioritaria: [% del capitale sociale + % Amministratori] / 2 > 50%
Forte: [% del capitale sociale + % Amministratoril / 2 > 66%
Esclusiva: [% del capitale sociale + % Amministratori] / 2 = 100%
?: Non disponibile

I dati sulla prevalenza sono riferiti al trimestre precedente

prevalenza straniera
NO

Legenda prevalenza femminile/giovanile/straniera
NO: [% del capitale sociale + % Amministratori] / 2 ≤ 50%
Maggioritaria: [% del capitale sociale + % Amministratori] / 2 > 50%
Forte: [% del capitale sociale + % Amministratoril / 2 > 66%
Esclusiva: [% del capitale sociale + % Amministratori] / 2 = 100%
?: Non disponibile

I dati sulla prevalenza sono riferiti al trimestre precedente

Please select listing to show.