print preview Ritornare alla pagina precedente Visione d'insieme, attualità, manifestazione

Riconoscere più velocemente le «fake news»

Immaginate cosa succederebbe se la consigliera federale Viola Amherd invitasse su Twitter ad acquistare un prodotto o a versare denaro su un conto bancario. Inimmaginabile? Purtroppo nell’era degli account social violati dagli hacker non è impossibile. armasuisse S+T ha avviato un progetto di ricerca volto a smascherare rapidamente i tweet falsi.

26.10.2020 | Dr. Gérôme Bovet, Direttore Data Science, armasuisse Scienza e tecnologia

Una mano tiene uno smartphone. Sullo schermo si può vedere la pagina di login di Twitter.
Dal 2021, armasuisse S+T studierà un modo per riconoscere più velocemente i messaggi falsi su Twitter.

Si tratta di un problema tipico dell’Era di Internet, al quale armasuisse Scienza e tecnologia (S+T) ha scelto di dedicarsi. In collaborazione con l’Università di Scienze Applicate Zurigo (ZHAW), armasuisse S+T persegue l’obiettivo di proteggere il panorama social dai messaggi falsi. L’occasione per farlo è stata data dall’attacco su Twitter dello scorso luglio, in occasione del quale un messaggio fraudolento è stato postato sugli account di Barack Obama, Elon Musk e Bill Gates. Gli hacker hanno così diffuso un testo falso che invitava ad acquistare una somma nella criptovaluta Bitcoin e versarla su un determinato conto bancario. Tutto questo con la promessa di ricevere l’importo raddoppiato.

Un modello che impara come scrivono gli utenti

Dal 2021, armasuisse S+T e la ZHAW studieranno insieme un algoritmo in grado di riconoscere le fake news sui social media per mezzo del cosiddetto Natural Language Processing (NLP). Questo approccio funziona attraverso un algoritmo che apprende il modo di scrivere di un utente e riconosce in base a caratteristiche personali quando un contributo viene redatto e pubblicato da un’altra persona a suo nome. A questo scopo, un modello viene addestrato per mezzo di record dati, ovvero post e tweet già pubblicati, e poi utilizzato per creare un profilo personalizzato dell’utente. Il modello tiene conto tra le altre cose del vocabolario utilizzato, dell’interpunzione, della lunghezza delle frasi ecc. Se viene digitato un tweet che differisce dal profilo utente creato, ne viene riconosciuto il carattere anomalo.

Schermata del tweet postato dall'account di Barack Obama dopo l'attacco hacker al suo account Twitter. In inglese: I am giving back to my community due to Covid-19! All Bitcoin sent to my address below will be sent back doubled. If you send $1'000, I will send back $2'000!
Schermata del tweet postato dall'account di Barack Obama dopo l'attacco hacker al suo account Twitter.
© Twitter Inc.

Sfida Twitter

L’approccio dell’NLP non è nuovo. La novità è la brevità dei testi con i quali deve operare il programma. Nel panorama della ricerca esistono già dei software in grado di riconoscere tramite NLP i testi che non sono redatti dall’autore previsto. Tuttavia, di solito questi testi sono lunghi diverse pagine. Su Twitter invece la comunicazione è più succinta, perché un tweet è limitato a 280 caratteri. La sfida consiste quindi nell’insegnare al modello a smascherare un utente falso basandosi su un numero molto limitato di caratteri.

Capita di rado che gli opinion maker più noti twittino di persona. Spesso alle loro spalle opera un team incaricato di postare a nome loro. Questo non dovrebbe però impedire al programma di riconoscere quando i tweet vengono pubblicati da una persona non autorizzata. Ad esempio, dovrebbe essere possibile stabilire se qualcuno improvvisamente scrive in uno stile inconsueto su un tema totalmente nuovo che non corrisponde al suo profilo attuale.

Un approccio che si spinge più avanti di quelli di Twitter & Co. 

Anche gli operatori delle piattaforme social adottano misure per rilevare i messaggi falsi. Spesso a questo scopo classificano i metadati dei post (ad esempio hashtag utilizzati, link, orari dei post e numero di caratteri) per individuare eventuali anomalie. Se quindi un utente utilizza ad esempio un link a una pagina di phishing, il programma lo riconosce e può così rilevare un utente falso. Con questo metodo la macchina riconosce solo la struttura di un contributo. Con l’approccio NLP invece, il computer riconosce e confronta i contenuti, un’operazione complessa che richiede nuovi metodi.

L’avvio delle attività di ricerca di armasuisse S+T e della ZHAW è previsto per il 2021. Si prevede la creazione di un’applicazione dimostrativa entro i sei e dodici mesi successivi. In base ai risultati della ricerca si deciderà quindi se proseguire con questo approccio.