La sicurezza di servizi essenziali come trasporti, elettricità e acqua passa anche attraverso l’analisi dei big data. È questo l’obiettivo del software Obserbot - dall’unione delle parole ‘Observer’ e ‘Robot’ - che renderà possibile acquisire ed elaborare tutte le informazioni che circolano nel web sui danni subiti dalle infrastrutture critiche a causa di guasti, eventi naturali ma anche attentati terroristici. Realizzato da un team di ricercatori dell’ENEA, Obserbot sarà presentato oggi 2 febbraio a Roma presso la sede dell’ENEA nel corso del convegno “Big Open data analysis”.
“Si tratta di un software in grado di osservare in maniera totalmente automatizzata la rete grazie alla potenza della nostra infrastruttura di calcolo ENEAGRID/CRESCO e alla rete nazionale a banda ultralarga GARR”, spiega Vittorio Rosato, responsabile del Laboratorio ENEA di Analisi e protezione delle infrastrutture critiche. “Tra le novità - aggiunge Rosato - la possibilità di acquisire i dati anche da social network, agenzie di stampa e blog. L’analisi di queste informazioni è molto delicata perché queste fonti richiedono una verifica approfondita del contenuto ma restituiscono una conoscenza diretta dello stato delle infrastrutture grazie alle informazioni messe in rete dagli utenti stessi, il cosiddetto fenomeno del crowdsourcing. In questo modo - conclude Rosato - inauguriamo anche un nuovo modo di ascoltare i cittadini e di renderli proattivi nel favorire la sicurezza e la protezione della collettività e dei servizi essenziali”.
“Grazie ad Obserbot - sottolinea il ricercatore ENEA Gregorio D’Agostino, team leader dello sviluppo del software - ora siamo in grado di individuare gli influencer, ossia quelle persone che più di altre contribuiscono alla formazione delle opinioni e degli interessi generali, e di misurare la tendenza dei navigatori virtuali ad essere influenzati. Un elemento rilevante per questi studi, sviluppati in collaborazione con la Boston University, è stato il concetto di “temperatura della lingua” basato sulla frequenza di ripetizione delle parole nei testi, che consente di avvicinare l’analisi automatica di un messaggio a criteri più “umani” nel processo di individuazione delle informazioni d’interesse.
Il risultato ottenuto dal team ENEA è stato la realizzazione di una piattaforma in continua espansione capace di arricchirsi, in modo del tutto automatizzato, con le informazioni su incidenti e blackout alle infrastrutture critiche pubblicate online dagli internauti. Dati che il software ENEA classifica in modo molto accurato secondo criteri elaborati a livello europeo insieme al centro di ricerca olandese TNO in base alla tipologia di evento (ad esempio calamità naturale, malfunzionamento, attacco o cattiva manutenzione) e di infrastruttura coinvolta, di località interessata, tempistica e danni conseguenti.
Attualmente la Rete costituisce un’enorme fonte di informazioni su quanto avviene nel mondo, ma anche sulle persone, su ciò che pensano e le emozioni che provano. La dimensione del web è sconfinata: si stima che ci siano 1 miliardo di siti e 5 miliardi di pagine web. I social network contribuiscono costantemente all’aumento di queste dimensioni, visto che ogni secondo nel mondo vengono pubblicati 6.000 tweet e spediti oltre 2 milioni di messaggi di posta elettronica. In questo senso, l’analisi dei dati della rete costituisce un’incredibile sorgente di conoscenza e poter accedere a queste informazioni può risultare strategico anche per il progresso della ricerca scientifica.