Clear Sky Science · sv
En global twitter-analysmodell för sentiment kring COVID-vaccin
Varför känslor om vacciner på Twitter spelar roll
Under COVID-19-pandemin förlitade sig regeringar på vaccin och allmänhetens samarbete för att rädda liv. Ändå reagerade människor runt om i världen mycket olika på vaccinationskampanjer och uttryckte ofta sina hopp och rädslor i sociala medier. Denna studie går bortom enkla ”positiva” eller ”negativa” etiketter på tweets och ställer en djupare fråga: hur ter sig människors kommentarer om COVID-19-vaccination när vi tar hänsyn till hur hårt deras eget land drabbats av viruset? Genom att blanda tweet-text med verkliga pandemidata vill författarna fånga vad ett meddelande verkligen betyder i dess bredare globala sammanhang.
Från råa tweets till första bedömning av känsloläge
Forskarna började med att samla in över fyrtio tusen engelskspråkiga tweets om COVID-19-vaccination som postades våren 2021, en avgörande period då många länder nådde stora vaccinationsmilstolpar. De rensade data genom att ta bort användarnamn och webblänkar som inte hjälper vid bedömning av ton. För att tilldela varje tweet en initial sentiment använde de en modern språkmodell särskilt tränad på Twitter-innehåll, känd som Twitter-roBERTa. Denna modell sorterar tweets i tre grundläggande kategorier: positiv, negativ eller neutral, enbart baserat på texten. Författarna kallar detta första lager av märkning för tweetens ”lokala sentiment”, eftersom det bortser från vad som sker i resten av världen.

Lägga till pandemins verkliga status
Nästa steg var att teamet samlade in landsspecifika COVID-19-statistik—antal fall, dödsfall och befolkningsstorlek—för tio länder spridda över Nordamerika, Europa, Asien och Oceanien. De omvandlade dessa siffror till ett enda ”svårighetsvärde” för varje land, som visar hur hårt det drabbats i förhållande till de andra under studieperioden. En tweet från ett land med höga fall- och dödstal tolkas alltså i ett mycket annat ljus än en identisk tweet i ett land med mildare förhållanden. Forskarna slog sedan ihop varje tweet med svårighetsvärdet för det land den sannolikt kom från, genom att använda användarnas självrapporterade platser och noggrant kurerade listor över städer och regioner för att kartlägga platser till länder.
Att omvandla lokala känslor till globala nyanser av opinion
Med både tweet-text och landssammanhang i handen utformade författarna tre metoder för att förfina varje tweets etikett från en enkel positiv/negativ/neutral märkning till ett rikare ”globalt sentiment”. De två första metoderna använder sannolikhetsregler (Bayes’ teorem) för att mäta hur vanligt varje typ av sentiment är inom ett land eller inom två breda grupper av länder: de i relativt ”gott” respektive ”dåligt” pandemiläge. En tweet som går emot den rådande stämningen i sin kontext, till exempel en sällsynt positiv kommentar i ett hårt drabbat land, behandlas som ett uttryck med ”hög intensitet”, medan en tweet som ekar en vanlig åsikt behandlas som med ”låg intensitet”. Metod 2 skiljer dessutom mellan ”svagt” och ”starkt” positiva eller negativa etiketter, beroende på om tweetens ton passar eller motsäger landets situation.

En smartare modell för att lära intensitet automatiskt
Den tredje metoden använder ett mer avancerat statistiskt tillvägagångssätt kallat bayesiansk flernivå ordinal regression. Istället för att förlita sig på fasta gränsvärden lär sig denna modell, från själva data, hur tweetnivåns sentimentskattningar (härledda från Twitter-roBERTa-sannolikheterna) interagerar med pandemins svårighetsgrad i varje land. Den tar hänsyn till skillnader mellan länder samtidigt som den fortfarande samlar information över dem. Modellen uppskattar sedan, för varje tweet, inte bara om den är negativ, neutral eller positiv utan också hur säkert den tillhör den kategorin. Tweets vars modellbaserade sannolikheter är högre än vad som är typiskt för deras kategori märks som ”hög intensitet”; andra markeras som ”låg intensitet”. Detta skapar nyanserade globala sentimentetiketter som speglar både språkbruk och folkhälsokontext.
Vad resultaten betyder för att förstå folkets sinnestillstånd
När författarna använde dessa nya globala sentimentetiketter för att träna vanliga maskininlärningsklassificerare fann de att de nyanserade etiketterna—särskilt de som producerades av den avancerade modellen—hjälpte klassificerarna att lära mer korrekta mönster än de grövre metoderna. I praktiska termer betyder detta att folkhälsomyndigheter, forskare och analytiker av sociala medier kan få en skarpare bild av hur människor verkligen känner inför vaccin genom att betrakta tweets genom ett globalt perspektiv, inte bara läsa orden isolerat. Två personer kan låta lika frustrerade över vaccination, men om den ena bor i ett land som kämpar med ett allvarligt utbrott och den andra i ett land där läget är under kontroll, väger deras budskap olika tungt. Genom att fånga dessa skillnader i intensitet erbjuder studien ett mer förankrat sätt att övervaka allmänhetens sentiment och utforma svar som bättre motsvarar de verkligheter människor står inför.
Citering: Chakrabarty, D., Chatterjee, S. & Mukhopadhyay, A. A global twitter sentiment analysis model for COVID-vaccination. Sci Rep 16, 9005 (2026). https://doi.org/10.1038/s41598-026-38553-0
Nyckelord: COVID-19-vaccination, Twitter-sentiment, analys av sociala medier, folkhälsokommunikation, maskininlärning