L'innovazione nel territorio

GeosmartMagazine

L'innovazione nel territorio

Kritika

Startupeasy -

ATTIVITA’ DI KRITIKA
La società Kritika ha come principale attività la costruzione di un servizio di Adverse Media sulle fonti italiane: software proprietario raccoglie e seleziona le notizie di stampa avversa dai media online inerenti aziende e persone e le preseleziona e precataloga per offrirle in vaglio ad un team di redattori.
Nel corso del 2022 si addestreranno i sistemi per poter acquisire ed analizzare anche le fonti estere più importanti.
Lo scopo dell’attività è efficientare il lavoro di selezione qualitativa delle notizie di Adverse Media per i clienti.

Copertura
Il parco fonti online analizzato copre l’intero panorama istituzionale italiano, tra quotidiani nazionali e locali. 850 testate in continuo aggiornamento e circa 10 mila articoli analizzati ogni giorno.
Al termine dell’integrazione delle fonti estere la mole delle notizie acquisite sarà di conseguenza incrementata.

Tecnologia
Algoritmi proprietari di machine learning (ML) pre-selezionano le notizie e le classificano (attribuzione di uno score) in base ai reati citati nei testi; il sistema di analisi semantica Expert System identifica persone e aziende di interesse. Il software è addestrato per riconoscere e classificare in automatico oltre 120 reati.

Redazione
Un team di analisti dedicati, vaglia la pertinenza del semilavorato automatico e, su richiesta, verifica e disambigua aziende e persone per garantire la qualità dei contenuti raccolti.

Archivio e aggiornamenti periodici
Kritika attinge ad un archivio storico (15 anni di notizie) che vanta oltre 800 mila soggetti (aziende e persone) classificati e indicizzati. Il servizio di archivio è affiancabile all’aggiornamento periodico delle news di interesse.

Monitoraggio Early Warning
Kritika eroga sistemi di “alerting” via mail sulle notizie di stampa avversa su elenchi di soggetti, entro 48h dalla pubblicazione della notizia

Piattaforma Proprietaria
In via di implementazione (nei primi sei mesi di attività) una piattaforma proprietaria di raccolta, indicizzazione, analisi e ricerca dei contenuti raccolti dai vari media, classificati dagli algoritmo di ML e vagliati dai redattori.
La piattaforma permetterà ricerche per nome/cognome persona, nome azienda, parole chiave, eventi/reati, località geografica e la generazione di grafici interattivi riassuntivi.

I SERVIZI DI KRITIKA
Adverse Media
Kritika raccoglie e seleziona le notizie di stampa avversa su aziende e persone entro 48h dalla pubblicazione
Kritika costruirà un archivio storico classificato e indicizzato di stampa avversa – 15 anni di notizie – su oltre 800 mila soggetti (persone e aziende)
Kritika eroga sistemi di “alerting” via mail sulle notizie di stampa avversa su elenchi di soggetti, oppure permette ricerche con dettaglio dei codici fiscali di aziende e persone e degli eventi negativi associati

Market Intelligence
Kritika archivia le notizie di interesse aziendale in ambito corporate e marketing
Kritika classifica le notizie per settore merceologico, per codice ateco, per evento di business
Sono possibili studi e trend per settore merceologico, area geografica e con dettaglio degli eventi di business e del sentiment

Corporate e Brand Reputation
Kritika realizza studi reputazionali su persone, aziende, marchi e prodotti
Kritika vuole coprire i principali media: agenzie, stampa e web
Kritika analizza e confronta i trend reputazionali di aziende per settori merceoligici

I PUNTI DI FORZA DI KRITIKA

Compliance
Tutte le fonti sono acquisite tramite accordi specifici con gli Editori in corso di definizione, nel rispetto delle normative sul diritto d’autore.
Tutti i dati sono trattati nel rispetto delle normative GDPR e del diritto all’oblio.

Tecnologia
Le notizie sono acquisite in formato digitale, classificate e indicizzate con sistemi di AI e ML
Aziende e persone citate sono identificate con sistemi di matching proprietari
La metodologia che supporta le tecnologie di aggregazione, scoring e classificazione degli articoli per la riproposizione ai redattori è stata depositata in Siae nel maggio 2016 e rinnovata per altri 5 anni nel maggio 2021.

Qualità
Il lavoro di un team di redattori dedicati garantisce una elevata qualità di classificazione e di disambiguazione dei soggetti citati
La preselezione automatica del software garantisce al team di redazione un elevato livello di pertinenza dei contenuti da vagliare.

Settore: IT
Labels: MachineLearning, MediaAnalytics
Canali di Vendita: Directly
Interessi: Business partners, Customers, Incubator / Coworking spaces, Lender / Investor, Partner university, Technical support figures

Stadio della startup Kritika

Prodotto/Servizio

Monitoraggio Adverse Media Il servizio di Monitoraggio Adverse Media di Kritika, permette di tenere sotto monitoraggio continuo, con un ritardo massimo di 48 ore, portafogli di soggetti (persone fisiche o giuridiche) relativamente ad ogni nuova notizia da fonti stampa e online. Il sistema è applicato a tutti gli articoli delle oltre 900 fonti quotidianamente monitorate. Il portafoglio può essere aggiornato da parte del cliente ad intervalli periodici (con cadenza minima mensile). Erogazione notifiche Le notifiche al cliente possono avvenire in due modalità: 1. sistema di alerting via e-mail ad un insieme di destinatari predefinito, con indicazione del soggetto identificato dalla notizia, l’età (quando presente), il relativo reato, la data di pubblicazione e la località 2. tramite chiamata API, per permettere al cliente, ad intervalli regolari (quotidianamente, settimanalmente), di recuperare in formato digitale le sole uscite stampa relative ai soggetti del proprio portafoglio, con indicazione del nominativo monitorato (comprensivo, quando presente di località, età e reati) e dei dettagli dell’articolo. Questa modalità si presta ad integrazione nel database o sistema del cliente. Gli estiti del monitoraggio di un perimetro di soggetti possono produrre: • “Soggetti Green”: ovvero non associato a nessuna problematica di Adverse Media • “Soggetti Yellow” in seguito a disambiguazione da falso positivo: un nominativo evidenziato dal monitoraggio, ma disambiguato grazie ai sistemi automatici e/o al lavoro degli analisti di B4Compliance • “Soggetti Redflag”, quindi con eventuale necessità di analisi, ovvero analisi puntuale dell’anagrafica, tesa alla identificazione del soggetto con certezza • “Soggetti Resolved”: la capillarità del monitoraggio permette di rilevare le notizie relative ai casi di assoluzione dei soggetti segnalati. Piattaforma tecnologica e sicurezza Nel caso in cui il cliente, per esigenze di riservatezza dei dati, non possa effettuare un upload periodico del proprio portafoglio verso i server di B4Compliance, è possibile individuare un server virtuale in cloud dedicato e raggiungibile tramite un tunnel VPN esclusivamente dal cliente stesso. Su questa piattaforma in cloud dedicata, il cliente può effettuare l’upload del proprio portafoglio tramite un sistema crittografato sicuro: ftp, API, meccanismo a code, ecc Il nostro team IT potrà installare una copia del sistema di matching delle notizie e di notifica verso il cliente (invio mail oppure servizio di API). Scoring personalizzato Il sistema di rilevazione e matching Kritika è predisposto all’attribuzione personalizzata di score ad ogni soggetto rilevato nelle notizie, sulla base dei seguenti parametri: • classificazione in base alla gravità del reato • grado di giudizio • presenza di parole chiave con alert Lo score può essere identificato tramite sistema numerico “rinormalizzato” su una scala concordata con il cliente e contemporaneamente rappresentato tramite indicatori grafici (rosso, arancione, giallo, grigio, ecc) in modo da essere restituito al cliente tramite API, ma anche erogato nelle notifiche via e-mail.

Team

Dati della startup Kritika

Costituzione Impresa : 08/10/2021
Data iscrizione alla sezione delle Startup: 08/10/2021
Denominazione:
KRITIKA S.R.L.
Comune: MILANO
Provincia: Milano
Regione: Lombardia
Codice Fiscale: 12020210964
Forma Giuridica : SOCIETA' A RESPONSABILITA' LIMITATA
Codice Ateco : 6202
Settore: IT

Kritika

Modello di Business

Vendita prodotto adverse media

Innovazione

Breve descrizione degli aspetti di innovazione che caratterizzano il business dell’impresa ATTIVITA’ INNOVATIVA DI KRITIKAIl contenuto tecnologico innovativo di Kritika è descritto nei seguenti punti.Acquisizione Fonti Web Tramite sistema di crawling proprietario sono acquisiti gli articoli dalle fonti web monitorate. Il motore di ricerca “scansiona” periodicamente un parco fonti online di oltre 5 mila siti italiani ed estrae i contenuti “ripuliti” dai tag HTML di formattazione, dalle pubblicità, dai banner vari e li riformatta secondo lo schema di classificazione titolo/testo/autore/data/parole chiave, producendo in output un file json per ogni articolo.Acquisizione Fonti Stampa Tramite sistemi di analisi proprietari dei Pdf in formato stampa delle testate giornalistiche cartacee (quotidiani e periodici) e tramite un sistema di matching che effettua la scansione e il recupero dei contenuti dai file (tipicamente in formato XML) estratti dai sistemi editoriali delle testate, il software ricompone in formato digitale gli articoli delle testate. Il software produce in output e in formato json un file per ogni articolo formattati secondo lo schema titolo/testo/autore/data/parole chiave, esattamente come per le testate online. In questo modo è in grado di costruire un database proprietario dei contenuti “omogeneizzando” gli articoli presi dalle fonti online con quelli proveniente dalle fonti offline (stampa).Ritagli Stampa Interattivi Al contrario di tutti i provider di rassegna stampa e sistemi di monitoraggio che forniscono i “ritagli” in formato immagine (quindi delle “foto” dei giornali) per la lettura degli articoli stampa, Kritika ha sviluppato un sistema innovativo proprietario per la ricomposizione in formato HTML dinamico degli articoli dei giornali, in modo che appaiano formattati esattamente come sulla versione stampata, ma generati “on the fly” in formato digitale. Questa modalità è particolarmente vantaggiosa: i contenuti sono molto più “leggeri” da scaricare, si adattano allo schermo del lettore, sono “multimediali”, quindi possono contenere link ipertestuali ad altri contenuti.Utilizzo di Database Documentali non Relazionali La piattaforma software deve gestire con efficienza massima due “problematiche”. 1. Indicizzazione full text per supportare ricerche per parole chiave mirate su decine di milioni di articoli 2. Supporto per strutture dati flessibili, meglio se “ad oggetti” Per soddisfare queste due esigenze si sono scelti due database non relazionali ormai molto diffusi: • ElasticSearch è utilizzato per salvare, indicizzare e ricercare gli articoli. Questo engine permette di effettuare ricerche su indici testuali fino a 50-60 Giga di dati, ovvero 20-30 milioni di articoli, in tempi di centesimi di secondo su hardware standard • MongoDB è utilizzato per salvare e archiviare “staticamente” tutte gli articoli e per salvare tutte le anagrafiche (esempio persone, aziende), permettendo di modificare facilmente la struttura dei dati aggiungendo campi/oggetti ad un record in modo molto agevole.Classificazione Notizie tramite Machine Learning e Intelligenza Artificiale Tutti gli articoli prelevati dalle fonti online e offline sono trattati da un software di machine learning proprietario dedicato alla classificazione dei contenuti secondo le seguenti tassonomie: • eventi (es: indagini, fusioni acquisizioni, risultati finanziari) / reati (es: bancarotta, furto, evasione fiscale) – sono classificati oltre 120 reati • settore merceologico (energia, alimentare, automotive) – sono classificati oltre 25 settori merceologici • tag (innovazione, sostenibilità, ambiente)I classificatori sono addestrati tramite l’analisi dei contenuti già classificati dai redattori e “imparano” selezionando le parole / frasi più rilevanti per ogni categoria basandosi sulla frequenza delle stesse negli articoli rilevanti, rispetto alla frequenza generale nella base dati complessiva. Per questo tipo di analisi vengono sfruttate le API del database ElasticSearch che forniscono informazioni molto dettagliate sulla frequenza delle parole / espressioni su insiemi di documenti rispetto all’indice generale (tf/idf).La pipeline di lavorazione dei contenuti sfrutta in seguito software esterni di intelligenza artificiale e analisi semantica dei contenuti per assolvere a due ulteriori compiti: • rilevazione delle località in cui è collocata una notizia • identificazione delle persone citate, delle aziende citate e delle organizzazioni citate nell’articolo In questa prima fase è utilizzato il sistema Cogito di Expert System in modalità API cloud per l’arricchimento semantico: si tratta della piattaforma più diffusa e con maggiore “storia” alle spalle per l’analisi dei documenti testuali. La pipeline di Kritika si deve “agganciare” alle API di Cogito ed estrarre le informazioni necessarie per l’identificazione delle località e dei soggetti e aggiungere al proprio formato di dati.Aggregazione Notizie tramite Algoritmi di Clustering Molto importante per poter ridurre drasticamente il tempo di lavorazione degli analisti è la fase di aggregazione degli articoli in notizie. Questo passo permette di ottenere un “cluster” unico che inglobi tutte le fonti che quotidianamente abbiano coperto la stessa notizia, per similitudine semantica. Sono sfruttati per questa operazione i migliori algoritmi di clustering non supervisionato applicato a documenti testuali già oggi diffusi. Scopo del lavoro del team IT di Kritika è la selezione degli algoritmi più performanti sia dal punto di vista della velocità di elaborazione sia dal punto di vista dell’efficienza nella fase di aggregazione (evitare che articoli troppo “diversi” per contenuto siano aggregati nello stesso cluster).Algoritmi di Matching Aziende e Persone Sulla base delle informazioni raccolte dalle fasi di ML e AI precedenti un software proprietario ha il compito di provare ad identificare univocamente le persone e le aziende citate eventualmente nell’articolo. Il software di matching lavora su un articolo basandosi su: località dell’evento, settore merceologico (per disambiguare le aziende), età e/o ruolo della persona eventualmente citata (per disambiguare le persone). Solo nel caso in cui il livello di confidenza dell’algoritmo automatico sia sufficientemente alto sulla persona o azienda candidata viene proposto un suggerimento al team di analisi che dovrà vagliare l’articolo.

Requisiti di innovazione tecnologica

R&S

Team Qualificato

Proprietà Intellettuale

classe di produzione
1-100K euro
A

Leggenda Classe di Produzione
A=1-100K euro
B=100K-500K euro
C=500K-1M euro
D=1M-2M euro
E=2M-5M euro
F=5M-10M euro
G=10M-50M euro
H=più di 5OM di euro
ND=non disponibile

classe di addetti
0-4 addetti

Leggenda Classe di Addetti
A=0-4 addetti
B=5-9 addetti
C=10-19 addetti
D=20-49 addetti
E=50-249 addetti
F=almeno 250 addetti
ND=non disponibile

A
classe di capitale
10K-50K euro
4

Leggenda Classe di Capitale
1=1 euro
2=1-5K euro
3-5K-10K euro
4=10K-50K euro
5=50K-100K euro
6=100K-250K euro
7=250K-500K euro
8=500K-1M euro
9=1M-2,5M euro
10=2,5M-5M euro
11=più di 5M di euro
ND=non disponibile

prevalenza femminile
NO

Legenda prevalenza femminile/giovanile/straniera
NO: [% del capitale sociale + % Amministratori] / 2 ≤ 50%
Maggioritaria: [% del capitale sociale + % Amministratori] / 2 > 50%
Forte: [% del capitale sociale + % Amministratoril / 2 > 66%
Esclusiva: [% del capitale sociale + % Amministratori] / 2 = 100%
?: Non disponibile

I dati sulla prevalenza sono riferiti al trimestre precedente

prevalenza giovanile
NO

Legenda prevalenza femminile/giovanile/straniera
NO: [% del capitale sociale + % Amministratori] / 2 ≤ 50%
Maggioritaria: [% del capitale sociale + % Amministratori] / 2 > 50%
Forte: [% del capitale sociale + % Amministratoril / 2 > 66%
Esclusiva: [% del capitale sociale + % Amministratori] / 2 = 100%
?: Non disponibile

I dati sulla prevalenza sono riferiti al trimestre precedente

prevalenza straniera
NO

Legenda prevalenza femminile/giovanile/straniera
NO: [% del capitale sociale + % Amministratori] / 2 ≤ 50%
Maggioritaria: [% del capitale sociale + % Amministratori] / 2 > 50%
Forte: [% del capitale sociale + % Amministratoril / 2 > 66%
Esclusiva: [% del capitale sociale + % Amministratori] / 2 = 100%
?: Non disponibile

I dati sulla prevalenza sono riferiti al trimestre precedente