Clear Sky Science · de

ChunkyBERT: eine neuartige Technik zur Mehrklassen-Erkennung politischer Voreingenommenheit in den Medien

· Zurück zur Übersicht

Warum versteckte Neigungen in Nachrichten wichtig sind

Jeden Tag scrollen Menschen durch politische Schlagzeilen, ohne zu bemerken, wie Wortwahl und Auswahl von Geschichten still und leise ihre Sichtweisen lenken können. Diese Studie stellt ChunkyBERT vor, ein Computermodell, das darauf ausgelegt ist zu erkennen, ob lange Nachrichtenartikel links, zentriert oder rechts tendieren, und dabei den vollständigen Text anstelle weniger handverlesener Hinweise nutzt. Ziel ist es, Leser, Journalisten und Aufsichtsorgane dabei zu unterstützen, Voreingenommenheit in modernen digitalen Medien klarer zu erkennen.

Wie politische Neigung beeinflusst, was wir lesen

Nachrichtenmedien können die Meinungsbildung nicht nur durch das, was sie sagen, beeinflussen, sondern auch durch das, was sie weglassen, wie sie Ereignisse rahmen und welche emotionalen Formulierungen sie verwenden. Im Zeitalter von Online-Plattformen kann das Spaltungen vertiefen, Echokammern nähren und irreführende Informationen verbreiten. Frühere computergestützte Werkzeuge versuchten, dies zu messen, indem sie positive oder negative Wörter zählten oder die Häufigkeit bestimmter Begriffe verfolgten. Diese Ansätze sind zwar nützlich, haben jedoch Probleme mit Kontext, etwa Ironie oder subtilem Framing, und erfordern oft viel manuelle Vorarbeit durch Expertinnen und Experten.

Von handgefertigten Hinweisen zum vollständigen Lesen

Jüngste Fortschritte in der Sprachtechnologie erlauben es Modellen, Bedeutung direkt aus Rohtext zu erlernen. Systeme auf Basis neuronaler Netze und Transformer, wie BERT, erfassen, wie Wörter einander in einem Satz und über Absätze hinweg beeinflussen. Viele frühere Studien nutzten diese Werkzeuge für Hassrede-, Fake-News- oder Sentiment-Erkennung, und einige versuchten, politische Neigung aus kurzen Überschriften oder Tweets abzuschätzen. Lange politische Artikel bleiben jedoch eine Herausforderung, weil Standardmodelle begrenzt sind, wie viel Text sie auf einmal verarbeiten können, und weil Hinweise auf Voreingenommenheit über die gesamte Geschichte verteilt sein können, statt in einem einzigen prägnanten Zitat zu stehen.

Figure 1. System, das vollständige politische Artikel liest und sie in links, zentriert oder rechts eingeordnete Gruppen sortiert.
Figure 1. System, das vollständige politische Artikel liest und sie in links, zentriert oder rechts eingeordnete Gruppen sortiert.

Lange Artikel in handlichere Stücke zerlegen

ChunkyBERT begegnet diesem Problem, indem es jeden langen Artikel zunächst in gleich lange Abschnitte, sogenannte Chunks, aufteilt. Diese Chunks sind nicht an Sätze oder Absätze ausgerichtet, was den Prozess für das System einfach und vorhersehbar hält. Jeder Chunk wird dann durch ein vortrainiertes Sprachmodell geleitet, das Wörter in numerische Muster verwandelt, welche ihre Bedeutung im Kontext einfangen. Eine zweite Transformer-Schicht verfeinert diese Muster, und ein Attention-Schritt erlaubt dem System, stillschweigend die Wörter und Phrasen hervorzuheben, die am aussagekräftigsten für die politische Neigung erscheinen, während neutraler Hintergrundtext heruntergewichtet wird.

Die Geschichte wieder zusammensetzen

Sobald jeder Chunk auf diese Weise zusammengefasst wurde, mittelt ChunkyBERT die Chunk-Zusammenfassungen zu einem einzelnen Gesamtfingerabdruck des Artikels. Dieser Fingerabdruck gelangt dann in eine finale Entscheidungsschicht, die zwischen links, zentriert oder rechts wählt. Die Forscher trainierten und testeten das System an mehr als 37.000 Nachrichtenartikeln mit bekannten politischen Labels, überwiegend aus US-Quellen. Sie verglichen ChunkyBERT mit traditionelleren Methoden des maschinellen Lernens und mit anderen neuronalen Modellen, darunter solche auf Basis rekurrenter Netze und zeitlicher Faltungen, sowohl mit als auch ohne Chunking und Attention.

Figure 2. Langer Artikel wird in kleinere Stücke geteilt, jedes Stück wird analysiert und dann zusammengeführt, um die politische Neigung zu bestimmen.
Figure 2. Langer Artikel wird in kleinere Stücke geteilt, jedes Stück wird analysiert und dann zusammengeführt, um die politische Neigung zu bestimmen.

Wie gut das System abschneidet

Die Experimente zeigten, dass ChunkyBERT Artikel mit einer Validierungsgenauigkeit von etwa 86 Prozent klassifizierte und auf einer standardisierten Trennungsmetrik, die prüft, wie gut die Klassen unterschieden werden, hohe Werte erzielte. Besonders gut erkannte es deutlich links- oder rechts gerichtete Stücke, während zentristische Artikel manchmal fälschlich einer Seite zugeordnet wurden, was ihren gemischteren Ton widerspiegelt. Eine Ablationsstudie, bei der die Autoren Teile des Modells deaktivierten, zeigte, dass sowohl das Chunking langer Dokumente als auch die Transformer-Schichten entscheidend für die hohe Leistung waren. Das System übertraf außerdem frühere Methoden zur Bias-Erkennung, die am selben Datensatz getestet wurden.

Was das für Nachrichtenleser bedeutet

Einfach ausgedrückt verhält sich ChunkyBERT wie ein sorgfältiger, unermüdlicher Leser, der ganze politische Artikel scannt und einschätzt, wo sie auf dem politischen Spektrum stehen. Es entfernt keine Voreingenommenheit aus den Nachrichten und entscheidet nicht, welche Ansichten richtig sind, kann aber dazu beitragen, Neigungen zu markieren, die sonst unbemerkt blieben. Mit Verfeinerung und Anpassung an andere Sprachen und Regionen könnten ähnliche Werkzeuge Medienüberwachung, Unterrichtsdiskussionen und Plattformen für digitale Bildung unterstützen und Menschen eine klarere Sicht darauf geben, wie Informationen geformt werden, bevor sie ihre Bildschirme erreichen.

Zitation: Loiya, D., Kulal, S.S., Reddy, M.S.M. et al. ChunkyBERT: a novel technique for multiclass political bias detection in news media. Sci Rep 16, 15323 (2026). https://doi.org/10.1038/s41598-026-46646-z

Schlüsselwörter: politische Medienvoreingenommenheit, Nachrichtenklassifizierung, Transformer-Modelle, BERT, digitale Bildung