Home / Costume & Società  / Attualità  / La pandemia spiegata ‘a parole’ con la sentiment analysis

La pandemia spiegata ‘a parole’ con la sentiment analysis

parole

Un team composto da ricercatori della IULM e della Federico II ha messo a punto un metodo per analizzare le parole e i topics usati dai giornali e dai politici sul tema coronavirus.

 

Nel corso della pandemia abbiamo attraversato fasi molto differenti. Ma un tratto di continuità è rappresentato certamente dal “racconto” mediatico della situazione che viviamo. Passando infatti dalle incertezze iniziali fino alla quarantena, e poi dalla ripresa fino ai timori di queste settimane per la cosiddetta seconda ondata, si è visto come gli umori delle varie testate e quelli della comunicazione istituzionale giochino sempre un ruolo fondamentale.

 

Il progetto CO.ME.T.A.

Per questa ragione un gruppo di ricercatori, guidati da Emma Zavarrone, professoressa associata in Statistica Sociale presso la Iulm di Milano, e da Maria Gabriella Grassia, ordinaria della analoga cattedra alla Federico II di Napoli, ha deciso di sviluppare un progetto di analisi statistica denominato CO.ME.T.A. (COvid-19 Media Textual Analysis).

 

Si tratta di una dashboard testuale, ovvero una piattaforma pensata per studiare i contenuti digitali, e che in questo caso offre la possibilità di analizzare il sentiment (lo stato d’animo) dell’opinione pubblica rispetto alla pandemia. L’indagine però si basa su un approccio inedito, che parte direttamente dalle parole più ricorrenti su alcuni organi di stampa e media, principalmente italiani, ma anche stranieri (in questo caso Il Corriere della Sera, Il Sole 24ore, Repubblica, Fanpage, Twitter, The Guardian e NYTimes), per trarre indicazioni sia sulla strategia di comunicazione che sulla percezione generale dell’emergenza.

 

Questa metodica, che naturalmente elabora dati provenienti dal web, avvalendosi anche di algoritmi per il machine learning (apprendimento automatico), ha preso il via individuando prima di tutto le due parole chiave meno amate degli ultimi mesi, ovvero covid e coronavirus. A quel punto si è cercato di capire quante volte queste keywords venissero utilizzate all’interno degli articoli di giornale, ma soprattutto con quali altri vocaboli fossero messe in relazione più spesso, al fine di individuare dei concetti ricorrenti (i cosiddetti topics), e conseguentemente il tono più o meno allarmistico, o al contrario ottimistico, dei contenuti monitorati.

 

Le parole della professoressa Zavarrone

«Il nostro principale obiettivo – ci conferma proprio la professoressa Zavarrone, prima ideatrice di questo progetto – era quello di comprendere quanto e soprattutto come la comunicazione relativa alla pandemia influisse sulla consapevolezza e quindi sulle scelte dell’”italiano medio” alle prese con l’emergenza. Questo perché riteniamo che, oltre alla quantità di dati a disposizione, per comprendere e governare al meglio il meccanismo e i riflessi dell’informazione sul sentiment del pubblico, sia ancora necessario studiare a fondo certe interrelazioni interne ai testi. E la nostra dashboard, che oggi contiene già oltre sette milioni di vocaboli, potrebbe rivelarsi molto utile in questa direzione».

 

 

Le testate principali e la comparazione Italia – Gran Bretagna

Ed infatti, dai dati raccolti finora, relativi al periodo che va da gennaio a maggio, e quindi comprensivi anche del lockdown, è emerso un quadro piuttosto complesso, riassunto però con sufficiente chiarezza nei due grafici riportati di seguito. In Italia, come evidenzia la tavola 1, i giornali hanno complessivamente avuto un approccio molto oscillante, fra il positivo (tracciato rosa) e il negativo (tracciato azzurro), convergendo verso una zona più neutra col passare delle settimane, quando le prime misure di contenimento hanno cominciato a dare i loro risultati.

 

Questo testimonia, secondo i ricercatori, un’assenza di visione strategica di medio periodo, che probabilmente ha contribuito non poco a disorientare i cittadini, e confermerebbe quindi la nostra tradizione di Paese un po’ “anarchico”.

Parole_1

Tavola 1 | Italia

Al capo completamente opposto si trova invece il noto quotidiano inglese The Guardian (ma il dato si potrebbe estendere con un margine di approssimazione a tutta la stampa britannica in generale).

 

Come si intuisce dalla tavola 2, le diverse posizioni contenute negli articoli, quelle ottimistiche e quelle pessimistiche, in questo caso non si sovrappongono e non sembrano affatto estemporanee, come accade per l’Italia. Al contrario, appaiono calibrate in modo mirato, per controbilanciare di volta in volta i corrispondenti sbalzi dell’opinione pubblica. E questo evidenzia quindi una precisa strategia e forse una maggiore continuità fra politica e informazione.

Parole_2

Tavola 2 | Gran Bretagna

La comunicazione di Conte

L’indagine del progetto CO.ME.T.A., come anticipato, si è focalizzata anche sul linguaggio della politica, analizzando ad esempio la comunicazione del presidente del Consiglio Giuseppe Conte, e riscontrando indici in aperta controtendenza rispetto a quelli decisamente altalenanti provenienti dei giornali italiani.

 

«Effettivamente – ci dice la professoressa Grassia -, mentre la stampa sembrava complessivamente incerta, le indicazioni che abbiamo raccolto esaminando gli articoli relativi agli interventi pubblici del presidente dicono che lui, nello stesso periodo che va da gennaio a maggio, è stato molto costante e coerente, e che le tematiche dei suoi discorsi si sono adeguate rapidamente alle diverse fasi. Il che secondo noi dimostra quanto il suo staff abbia lavorato in modo accurato».

 

Le word clouds infatti, le famose nuvole di parole, parlano chiaro. E dimostrano come gli argomenti chiave usati da Conte nei suoi interventi siano mutati nel passaggio tra la fase 1 e la fase 2 dell’emergenza. Nel primo periodo l’attenzione era centrata sulle misure da adottare e sulla sanità. Mentre dopo, l’esigenza di dare sicurezza ha spinto gradualmente la comunicazione del capo del governo soprattutto sui temi della gestione politica e del lavoro, come sintetizzato dalla tavola 3.

Tavola 3 | Word Clouds

Il confronto tra Corriere della Sera, Repubblica, The Guardian

progetto cometa 3

Corriere della Sera | Word Clouds

progetto cometa 4

Repubblica | Word Clouds

progetto cometa 5

The Guardian | Word Clouds

La scalabilità della dashboard

Tra le aspettative principali legate al progetto CO.ME.T.A. c’è naturalmente quella di utilizzare le varie proprietà di questo metodo anche in altri settori. «Ce lo auguriamo – conclude la professoressa Zavarrone -, perché la piattaforma si è già dimostrata versatile, nel corso di uno studio effettuato in precedenza sulle migrazioni, le violenze di genere e il body shaming. Inoltre anche altri lavori, come articoli e tesi di laurea, si basano sui dati che stiamo raccogliendo, per costruire gradualmente un ecosistema condiviso dedicato alla ricerca».

 

Di Giovanni Aiello

NESSUN COMMENTO

POSTA UN COMMENTO