E’ quanto si prefigge il progetto Sensei, al quale lavora anche l’Università di Trento, che ha previsto con largo anticipo il risultato del referendum britannico
Quando, nella notte tra il 23 e il 24 giugno, sulla base dei primi exit poll nei salotti televisivi si è cominciato a disquisire sulla rassicurante vittoria del “Remain” nel referendum britannico, “loro” hanno cominciato a sorridere. “Lasciamoli dire”, hanno pensato, mentre i giornali stampavano titoli che alla mattina sarebbero apparsi già vecchi e superati, ma soprattutto sballati. “Domani vedremo”. “Loro” sono i professori, i ricercatori, i programmatori di software, gli analisti del progetto “Sensei” che fin dal 15 giugno avevano previsto e detto come sarebbe andata a finire: vittoria della Brexit (acronimo di "Britain exit", Britannia esce, sottinteso dalla Ue) e sconfitta del “Remain” (Rimanere, in Europa). Nessuna palla di vetro, ma la paziente capacità di raccogliere enormi masse di dati, rastrellando il web e i social network più popolari come Twitter e Facebook piuttosto che i siti web delle testate più prestigiose, per poi filtrarle unendo le più qualificate competenze tecnologiche e le conoscenze più aggiornate nell’analisi semantica e linguistica. Analizzando in modo critico il “sentimento” della Rete, il progetto di ricerca, finanziato nell’ambito del Settimo programma quadro della Commissione Europea, ha anticipato con esattezza l’esito del referndum britannico. E indicato una strada, già percorsa anche per le elezioni spagnole, che promette di rivoluzionare il lavoro dei “sondaggisti”, con importanti e ancora non del tutto esplorate ricadute. Ce ne parla il prof. Giuseppe Riccardi, coordinatore del progetto per l’Università di Trento.
Prof. Riccardi, quando nasce il progetto Sensei e con quali obiettivi?
Sensei è un progetto europeo selezionato alla fine di un processo molto selettivo (meno del 10% di successo), della durata di tre anni. L’Università di Trento è coordinatrice del consorzio di quattro università e due aziende. L’obbiettivo è di sviluppare tecnologie e prototipi per “dare un senso” (da qui il termine Sensei) all'enorme massa di conversazioni di bloggers, giornalisti, etc. nell’ecosistema delle piattaforme di social media.
Il sistema è stato messo a punto per il referendum britannico oppure è stato già testato in altre occasioni?
E’ la prima volta che viene valutato in questo tipo di eventi con la tecnologia sviluppata all’interno del progetto Sensei. Versioni precedenti del sistema di analisi del “sentimento” erano state testate per le elezioni in Spagna.
A tre giorni dal referendum britannico i dati di Sensei confermavano il vento anti-UE. Cronaca di una Brexit annunciata?
Mentre anni fa le piattaforme digitali per facilitare conversazioni e promuovere idee e fare “lobby” erano solo all’inizio, possiamo ora dire che sono uno strumento utilizzato da tutti gli addetti ai lavori per raggiungere una gran quantità di persone, cittadini, utenti o clienti.
Sensei si prefigge di ridurre la complessità di analisi richiesta da una tale massa di dati, altrimenti non gestibile con i metodi tradizionali.
In che modo Sensei coglie il “sentimento” della Rete? Come è possibile trasformare milioni di post in numeri e previsioni affidabili?
Le analisi si basano sulle più avanzate ricerche nel campo della linguistica computazionale e dell’analisi di grandi basi di dati. L’affidabilità delle analisi è ancora allo studio. La possibilità di dialogare, di condividere ed estrarre risposte da milioni di persone rappresenta una grande sfida e un’opportunità di questi “canali” di interazione.
Che tipo di materiale si analizza sul web e sui social, quali e quante sono le fonti monitorate per il Brexit?
Le analisi vengono fatte sulla maggior parte delle lingue europee. La base di dati proviene da circa 400 sorgenti. Si può vedere in dettaglio quali sul sito www.sense-eu.info.
Come viene pesata l’attendibilità del contenuto delle conversazioni? Cosa si tiene in conto per bilanciare i commenti? E quali limiti presenta tale tipo di indagine?
Il senso viene estratto dalle parole, dal loro significato e dal contesto, in base alle notevoli basi di dati di riferimento utilizzate. I limiti – e insieme le sfide – attualmente sono la capacità di gestire sorgenti rumorose (ad esempio, lo stile di scrittura libero utilizzato o i cosidetti “disturbatori” delle conversazioni) e la capacità di costruire un vero e proprio dialogo tra milioni di persone. Vi sono ancora limiti nella visualizzazione di grandi masse di dati.
Cosa differenzia Sensei da altri tipi di sondaggi?
L’utilizzo molto efficace di tecniche di linguistica computazionale e gli algoritmi di apprendimento su basi di grandi dati.
Come cambierà in prospettiva il lavoro dei “sondaggisti” per le analisi di tipo istituzionale?
Mi auguro che ci sia maggiore contaminazione tra le tecniche classiche di carotaggio delle opinioni e le tecniche basate in maniera preponderante su metodi computazionali tipiche dell’intelligenza artificiale moderna.
Quali altre prospettive apre questo tipo di indagine? Quale contributo può offrire alle aziende, in ambito commerciale e industriale?
Direi che sia l’applicazione al Brexit sia il tipo di tecniche utilizzate si prestano benissimo alle necessità delle aziende. Peraltro siamo stati già contatti da aziende sia nazionali sia internazionali, a conferma dell’interesse per questo tipo di indagini. Auspico che anche chi amministra ai diversi livelli la cosa pubblica esplori questa opportunità di parlare con i propri cittadini utilizzando le più avanzate tecnologie.
Antonella Carlin
Augusto Goio
Lascia una recensione