Clear Sky Science · it

Un modello globale di analisi del sentiment su Twitter per la vaccinazione COVID

· Torna all'indice

Perché contano i sentimenti sui vaccini su Twitter

Durante la pandemia di COVID-19, i governi hanno fatto affidamento sui vaccini e sulla collaborazione della popolazione per salvare vite. Eppure le reazioni alle campagne vaccinali sono state molto diverse nel mondo, con persone che spesso esprimevano speranze e timori sui social media. Questo studio va oltre le semplici etichette “positive” o “negative” applicate ai tweet e pone una domanda più profonda: come appaiono i commenti sulla vaccinazione COVID-19 una volta considerato quanto il proprio paese è stato colpito dal virus? Integrando il testo dei tweet con dati reali sulla pandemia, gli autori mirano a cogliere cosa significhi veramente un messaggio nel suo più ampio contesto globale.

Dai tweet grezzi ai primi giudizi di sentimento

I ricercatori hanno iniziato raccogliendo oltre quarantamila tweet in lingua inglese sulla vaccinazione COVID-19 pubblicati nella primavera del 2021, un periodo cruciale in cui molti paesi raggiungevano tappe importanti nella campagna vaccinale. Hanno ripulito i dati eliminando tag degli utenti e link web che non aiutano a valutare il tono. Per assegnare un sentimento iniziale a ogni tweet hanno usato un moderno modello linguistico appositamente addestrato sui contenuti di Twitter, noto come Twitter-roBERTa. Questo modello classifica i tweet in tre categorie di base: positivo, negativo o neutro, basandosi esclusivamente sul testo. Gli autori definiscono questo primo livello di etichettatura il “sentimento locale” del tweet, perché ignora ciò che accade nel resto del mondo.

Figure 1
Figura 1.

Aggiungere lo stato reale della pandemia

Successivamente il team ha raccolto statistiche nazionali sul COVID-19 — casi, decessi e popolazione — per dieci paesi distribuiti in Nord America, Europa, Asia e Oceania. Hanno trasformato questi numeri in un unico “valore di gravità” per ciascun paese, che indica quanto è stato colpito rispetto agli altri nel periodo di studio. Un tweet proveniente da un paese con alti tassi di casi e decessi viene quindi interpretato in modo molto diverso da un tweet identico in un paese con condizioni più lievi. I ricercatori hanno poi unito ogni tweet con il valore di gravità del paese da cui probabilmente proveniva, usando le localizzazioni auto-dichiarate dagli utenti e liste curate di città e regioni per mappare le posizioni ai paesi.

Trasformare i sentimenti locali in sfumature di opinione globale

Con testo del tweet e contesto nazionale a disposizione, gli autori hanno progettato tre metodi per raffinare l’etichetta di ciascun tweet da una semplice classificazione positivo/negativo/neutro in un più ricco “sentimento globale”. I primi due metodi impiegano regole probabilistiche (teorema di Bayes) per misurare quanto sia comune ogni tipo di sentimento all’interno di un paese o all’interno di due ampi gruppi di paesi: quelli in condizioni pandemiche relativamente “buone” rispetto a quelli in condizioni “critiche”. Un tweet che va contro l’umore prevalente nel suo contesto, come un raro commento positivo in un paese gravemente colpito, viene trattato come un’espressione di “alta intensità”, mentre uno che rispecchia un’opinione comune viene considerato di “bassa intensità”. Il Metodo 2 distingue inoltre etichette positive o negative “deboli” e “forti”, a seconda che il tono del tweet si adatti o contraddica la situazione del paese.

Figure 2
Figura 2.

Un modello più intelligente per apprendere automaticamente l’intensità

Il terzo metodo utilizza un approccio statistico più avanzato chiamato regressione ordinale bayesiana multilivello. Anziché fare affidamento su soglie fisse, questo modello apprende dai dati stessi come i punteggi di sentimento a livello di tweet (derivati dalle probabilità di Twitter-roBERTa) interagiscono con la gravità della pandemia in ciascun paese. Tiene conto delle differenze tra paesi pur aggregando informazioni fra di essi. Il modello stima quindi, per ogni tweet, non solo se è negativo, neutro o positivo, ma anche con quanta sicurezza appartenga a quella categoria. I tweet le cui probabilità basate sul modello sono più alte del consueto per la loro categoria vengono etichettati come “alta intensità”; gli altri come “bassa intensità”. Questo crea etichette di sentimento globale sfumate che riflettono sia la lingua sia il contesto di sanità pubblica.

Cosa significano i risultati per comprendere l’umore pubblico

Quando gli autori hanno usato queste nuove etichette di sentimento globale per addestrare classificatori di uso comune nell’apprendimento automatico, hanno scoperto che le etichette più sfumate — in particolare quelle prodotte dal modello avanzato — hanno aiutato i classificatori a apprendere pattern più accurati rispetto ai metodi più rozzi. In termini pratici, ciò significa che agenzie di sanità pubblica, ricercatori e analisti dei social media possono ottenere un quadro più nitido di come le persone si sentono davvero riguardo ai vaccini guardando i tweet attraverso una lente globale, e non solo leggendo le parole isolate. Due persone possono sembrare ugualmente frustrate per la vaccinazione, ma se una vive in un paese alle prese con un focolaio grave e l’altra in un luogo dove la situazione è sotto controllo, i loro messaggi hanno un peso diverso. Catturando queste differenze di intensità, lo studio offre un modo più fondato per monitorare il sentimento pubblico e progettare risposte che si adattino meglio alle realtà che le persone stanno vivendo.

Citazione: Chakrabarty, D., Chatterjee, S. & Mukhopadhyay, A. A global twitter sentiment analysis model for COVID-vaccination. Sci Rep 16, 9005 (2026). https://doi.org/10.1038/s41598-026-38553-0

Parole chiave: Vaccinazione COVID-19, Sentiment su Twitter, Analisi dei social media, Comunicazione per la sanità pubblica, Apprendimento automatico