Clear Sky Science · de
ChunkyBERT: eine neuartige Technik zur Mehrklassen-Erkennung politischer Voreingenommenheit in den Medien
Warum versteckte Neigungen in Nachrichten wichtig sind
Jeden Tag scrollen Menschen durch politische Schlagzeilen, ohne zu bemerken, wie Wortwahl und Auswahl von Geschichten still und leise ihre Sichtweisen lenken können. Diese Studie stellt ChunkyBERT vor, ein Computermodell, das darauf ausgelegt ist zu erkennen, ob lange Nachrichtenartikel links, zentriert oder rechts tendieren, und dabei den vollständigen Text anstelle weniger handverlesener Hinweise nutzt. Ziel ist es, Leser, Journalisten und Aufsichtsorgane dabei zu unterstützen, Voreingenommenheit in modernen digitalen Medien klarer zu erkennen.
Wie politische Neigung beeinflusst, was wir lesen
Nachrichtenmedien können die Meinungsbildung nicht nur durch das, was sie sagen, beeinflussen, sondern auch durch das, was sie weglassen, wie sie Ereignisse rahmen und welche emotionalen Formulierungen sie verwenden. Im Zeitalter von Online-Plattformen kann das Spaltungen vertiefen, Echokammern nähren und irreführende Informationen verbreiten. Frühere computergestützte Werkzeuge versuchten, dies zu messen, indem sie positive oder negative Wörter zählten oder die Häufigkeit bestimmter Begriffe verfolgten. Diese Ansätze sind zwar nützlich, haben jedoch Probleme mit Kontext, etwa Ironie oder subtilem Framing, und erfordern oft viel manuelle Vorarbeit durch Expertinnen und Experten.
Von handgefertigten Hinweisen zum vollständigen Lesen
Jüngste Fortschritte in der Sprachtechnologie erlauben es Modellen, Bedeutung direkt aus Rohtext zu erlernen. Systeme auf Basis neuronaler Netze und Transformer, wie BERT, erfassen, wie Wörter einander in einem Satz und über Absätze hinweg beeinflussen. Viele frühere Studien nutzten diese Werkzeuge für Hassrede-, Fake-News- oder Sentiment-Erkennung, und einige versuchten, politische Neigung aus kurzen Überschriften oder Tweets abzuschätzen. Lange politische Artikel bleiben jedoch eine Herausforderung, weil Standardmodelle begrenzt sind, wie viel Text sie auf einmal verarbeiten können, und weil Hinweise auf Voreingenommenheit über die gesamte Geschichte verteilt sein können, statt in einem einzigen prägnanten Zitat zu stehen.

Lange Artikel in handlichere Stücke zerlegen
ChunkyBERT begegnet diesem Problem, indem es jeden langen Artikel zunächst in gleich lange Abschnitte, sogenannte Chunks, aufteilt. Diese Chunks sind nicht an Sätze oder Absätze ausgerichtet, was den Prozess für das System einfach und vorhersehbar hält. Jeder Chunk wird dann durch ein vortrainiertes Sprachmodell geleitet, das Wörter in numerische Muster verwandelt, welche ihre Bedeutung im Kontext einfangen. Eine zweite Transformer-Schicht verfeinert diese Muster, und ein Attention-Schritt erlaubt dem System, stillschweigend die Wörter und Phrasen hervorzuheben, die am aussagekräftigsten für die politische Neigung erscheinen, während neutraler Hintergrundtext heruntergewichtet wird.
Die Geschichte wieder zusammensetzen
Sobald jeder Chunk auf diese Weise zusammengefasst wurde, mittelt ChunkyBERT die Chunk-Zusammenfassungen zu einem einzelnen Gesamtfingerabdruck des Artikels. Dieser Fingerabdruck gelangt dann in eine finale Entscheidungsschicht, die zwischen links, zentriert oder rechts wählt. Die Forscher trainierten und testeten das System an mehr als 37.000 Nachrichtenartikeln mit bekannten politischen Labels, überwiegend aus US-Quellen. Sie verglichen ChunkyBERT mit traditionelleren Methoden des maschinellen Lernens und mit anderen neuronalen Modellen, darunter solche auf Basis rekurrenter Netze und zeitlicher Faltungen, sowohl mit als auch ohne Chunking und Attention.

Wie gut das System abschneidet
Die Experimente zeigten, dass ChunkyBERT Artikel mit einer Validierungsgenauigkeit von etwa 86 Prozent klassifizierte und auf einer standardisierten Trennungsmetrik, die prüft, wie gut die Klassen unterschieden werden, hohe Werte erzielte. Besonders gut erkannte es deutlich links- oder rechts gerichtete Stücke, während zentristische Artikel manchmal fälschlich einer Seite zugeordnet wurden, was ihren gemischteren Ton widerspiegelt. Eine Ablationsstudie, bei der die Autoren Teile des Modells deaktivierten, zeigte, dass sowohl das Chunking langer Dokumente als auch die Transformer-Schichten entscheidend für die hohe Leistung waren. Das System übertraf außerdem frühere Methoden zur Bias-Erkennung, die am selben Datensatz getestet wurden.
Was das für Nachrichtenleser bedeutet
Einfach ausgedrückt verhält sich ChunkyBERT wie ein sorgfältiger, unermüdlicher Leser, der ganze politische Artikel scannt und einschätzt, wo sie auf dem politischen Spektrum stehen. Es entfernt keine Voreingenommenheit aus den Nachrichten und entscheidet nicht, welche Ansichten richtig sind, kann aber dazu beitragen, Neigungen zu markieren, die sonst unbemerkt blieben. Mit Verfeinerung und Anpassung an andere Sprachen und Regionen könnten ähnliche Werkzeuge Medienüberwachung, Unterrichtsdiskussionen und Plattformen für digitale Bildung unterstützen und Menschen eine klarere Sicht darauf geben, wie Informationen geformt werden, bevor sie ihre Bildschirme erreichen.
Zitation: Loiya, D., Kulal, S.S., Reddy, M.S.M. et al. ChunkyBERT: a novel technique for multiclass political bias detection in news media. Sci Rep 16, 15323 (2026). https://doi.org/10.1038/s41598-026-46646-z
Schlüsselwörter: politische Medienvoreingenommenheit, Nachrichtenklassifizierung, Transformer-Modelle, BERT, digitale Bildung