Addestrare le intelligenze artificiali: i tool di annotazione

Sempre più spesso, per eseguire dei task di machine learning, si rende necessario il riconoscimento automatico di entità, chiamato NER (Named Entity Recognition).

Queste entità possono essere predefinite, come ad esempio nomi di località geografiche, organizzazioni, date e orari, oppure rilevanti per un settore specifico.

Se un’azienda volesse profilare i suoi utenti in base agli interessi che vengono menzionati sui social, il riconoscimento di entità permette di identificare automaticamente parti di testo rilevanti per esempio titoli di libri, film o canzoni.

Gli ambiti di applicazione della NER sono i più svariati e passano dall’estrazione di entità da documenti di natura legale, finanziaria e medica, alla classificazione automatica dei contenuti delle news passando per l’implementazione di sofisticati sistemi di raccomandazione.

Se dunque l’annotazione automatica è sempre più necessaria per personalizzare il proprio business, gli strumenti di annotazione disponibili sul mercato non sono sempre agevoli da utilizzare e spesso rallentano il work-flow.

Per questo Presago ha puntato a massimizzare la user-experience, sviluppando un annotatore che permette di etichettare grandi quantità di testi in tempi estremamente rapidi e con semplicità, anche da persone non esperte nel settore.

Il tool di annotazione permette di definire una lista personalizzata di entità da utilizzare per il tagging, e di selezionare i documenti da annotare in maniera casuale, in modo da evitare l’insorgere di bias che possono influenzare le performance dei sistemi di machine learning.

Le etichette possono essere applicate tramite un semplice click, selezionando una parola o un blocco di testo con il mouse o con il touchpad. A ogni etichetta viene assegnato un colore. Questo rende più rapido e intuitivo il passaggio da un tag all’altro e soprattutto più semplice il controllo finale dell’etichettatura.

Tramite il tool è possibile, infine, impostare degli obiettivi da raggiungere e scaricare i documenti annotati per darli in pasto ai motori di machine learning e produrre i modelli di classificazione desiderati.

Se hai necessità di annotare grandi quantità di dati e necessiti di uno strumento veloce e affidabile, contattaci per una consulenza gratuita. Possiamo aiutarti suggerendoti la soluzione più adatta alle tue esigenze.