Clear Sky Science · sv
ChunkyBERT: en ny metod för flervalsdetektion av politisk partiskhet i nyhetsmedia
Varför dolda lutningar i nyheter spelar roll
Varje dag bläddrar människor genom politiska rubriker utan att inse hur ordval och berättelseval tyst kan styra deras åsikter. Denna studie introducerar ChunkyBERT, en datormodell utformad för att upptäcka om långa nyhetsartiklar lutar åt vänster, mitten eller höger, med hjälp av hela texten i stället för några få handplockade signaler. Målet är att hjälpa läsare, journalister och granskare att tydligare se partiskhet i modern digital media.
Hur politisk lutning formar vad vi läser
Nyhetsmedier kan påverka opinionen inte bara genom vad de säger, utan också genom vad de utelämnar, hur de ramar in händelser och vilka emotionella uttryck de väljer. I tiden av onlinetjänster kan detta fördjupa splittringar, driva ekokamrar och sprida vilseledande information. Tidigare datorverktyg försökte mäta detta genom att räkna positiva eller negativa ord eller genom att spåra hur ofta vissa termer förekommer. Dessa verktyg är visserligen användbara, men har svårt med kontext, som sarkasm eller subtil inramning, och kräver ofta omfattande manuell uppsättning av experter.
Från handgjorda ledtrådar till heltextläsning
Senare framsteg inom språkteknologi gör att modeller kan lära sig betydelse direkt från råtexten. System baserade på neurala nätverk och transformermodeller, såsom BERT, kan fånga hur ord påverkar varandra i en mening och över stycken. Många tidigare studier har använt dessa verktyg för hatretorik, falska nyheter eller sentimentanalys, och vissa har försökt uppskatta politisk lutning utifrån korta rubriker eller tweets. Ändå är långa politiska artiklar fortfarande en utmaning, eftersom vanliga modeller har begränsningar i hur mycket text de kan läsa på en gång och eftersom tecken på partiskhet kan vara utspridda i hela artikeln snarare än samlade i ett enda slagkraftigt citat.

Att dela upp långa artiklar i enklare bitar
ChunkyBERT tar itu med detta genom att först dela varje lång artikel i mindre delar av lika längd, så kallade chunks. Dessa chunks är inte anpassade till meningar eller stycken, vilket håller processen enkel och förutsägbar för datorn. Varje chunk skickas sedan genom en förtränad språkmodell som omvandlar ord till numeriska mönster som fångar deras betydelse i kontext. Ett andra transformerlager förfinar dessa mönster, och ett attention-steg låter systemet diskret framhäva de ord och fraser som verkar mest avslöjande för politisk lutning samtidigt som neutralt bakgrundstext tonas ner.
Sätta ihop berättelsen igen
När varje chunk har sammanfattats på detta sätt beräknar ChunkyBERT ett medelvärde av chunk-sammanfattningarna till ett enda övergripande fingeravtryck för artikeln. Detta fingeravtryck går sedan vidare till ett slutgiltigt beslutslager som väljer mellan vänster, mitten eller höger. Forskarna tränade och testade systemet på mer än 37 000 nyhetsartiklar med kända politiska etiketter, mestadels från källor i USA. De jämförde ChunkyBERT med mer traditionella maskininlärningsmetoder och med andra neurala modeller, inklusive sådana baserade på rekurrenta nätverk och temporala konvolutioner, både med och utan chunking och attention.

Hur väl systemet presterar
Experimenten visade att ChunkyBERT klassificerade artiklar med en valideringsnoggrannhet på cirka 86 procent och ett starkt resultat på en standardiserad separationsmått som kontrollerar hur väl det särskiljer mellan klasserna. Det var särskilt bra på att upptäcka tydligt vänster- eller högerlutande texter, medan centristiska artiklar ibland misstogs för att luta åt ena eller andra hållet, vilket speglar deras mer blandade ton. En ablationsstudie, där författarna stängde av delar av modellen, visade att både chunkningen av långa dokument och transformerlager var avgörande för att uppnå hög prestanda. Systemet överträffade också tidigare metoder för partiskhetsdetektion som testats på samma dataset.
Vad detta betyder för nyhetsläsare
Enkelt uttryckt beter sig ChunkyBERT som en noggrann, outtröttlig läsare som skannar hela politiska artiklar och uppskattar var de ligger på den politiska skalan. Den tar inte bort partiskhet ur nyheterna, och den avgör inte vilka åsikter som är korrekta, men den kan hjälpa till att flagga lutningar som annars skulle kunna gå obemärkta förbi. Med vidareutveckling och anpassning till andra språk och regioner kan liknande verktyg stödja mediebevakning, klassrumsdiskussioner och digitala läskunnighetsplattformar, och ge människor en tydligare bild av hur information formas innan den når deras skärmar.
Citering: Loiya, D., Kulal, S.S., Reddy, M.S.M. et al. ChunkyBERT: a novel technique for multiclass political bias detection in news media. Sci Rep 16, 15323 (2026). https://doi.org/10.1038/s41598-026-46646-z
Nyckelord: politiskt mediebias, nyhetsklassificering, transformermodeller, BERT, digital läskunnighet