Clear Sky Science · de
Automatische Bewertung der Lesbarkeit von Bildungsinhalten basierend auf Graph-Repräsentationslernen
Warum das für Lehrende und Lernende wichtig ist
Wenn Lehrkräfte einen Lesetext auswählen, stehen sie vor einem heiklen Balanceakt: Der Text muss anspruchsvoll genug sein, um Fortschritt zu fördern, darf aber nicht so schwierig sein, dass Schüler aufgeben. Dieses Papier stellt eine neue Methode der künstlichen Intelligenz vor, die abschätzen kann, wie schwer ein Textabschnitt zu lesen ist, insbesondere bei Bildungsinhalten. Indem sie über einfache Zählungen von Wörtern und Sätzen hinaus auf die tiefere Struktur der Sprache blickt, zielt das System darauf ab, passende Texte genauer als traditionelle Lesbarkeitsformeln zuzuordnen.
Grenzen altmodischer Lesbarkeitswerte
Jahrzehntelang haben Schulen sich auf Formeln wie Flesch–Kincaid verlassen, die oberflächliche Hinweise — etwa Satzlänge und Silbenzahlen — zur Einschätzung der Schwierigkeit nutzen. Diese Methoden sind leicht zu berechnen, übersehen aber viele Aspekte realer Komplexität. Ein kurzer naturwissenschaftlicher Absatz voller Fachbegriffe oder ein Satz mit verschachtelter Struktur kann trotzdem als „einfach“ eingestuft werden, weil seine Wörter kurz und seine Sätze knapp sind. Infolgedessen können Lehrkräfte unbeabsichtigt Material zu schwierig für einige oder zu einfach für andere zuweisen, besonders in inhaltsreichen Fächern wie Naturwissenschaften und Sozialkunde.
Ein Blick ins Satzinnere
Die Autorinnen und Autoren schlagen einen anderen Ansatz vor, der jeden Satz wie ein Netzwerk behandelt. Jedes Wort wird zu einem Punkt (oder Knoten), und die grammatischen Verknüpfungen zwischen Wörtern — etwa Subjekt–Verb oder Verb–Objekt — werden zu Kanten. Entscheidend ist, dass die Stärke jeder Verbindung nicht nur von der Entfernung im Satz abhängt, sondern auch davon, welche Wortarten dazwischen stehen. Eine lange Strecke, gefüllt mit Inhaltswörtern wie Substantiven, Verben und Adjektiven, deutet auf einen mental anspruchsvollen Sprung hin; ein kürzerer Pfad oder einer, der überwiegend kleine Funktionswörter enthält, signalisiert einen leichteren Schritt. Psycholinguistische Forschung zeigt, dass solche langen, inhaltslastigen Umwege das Arbeitsgedächtnis belasten und das Verständnis verlangsamen, weshalb das Modell sie als Hinweise auf höhere Schwierigkeit nutzt.

Dem Netzwerk beibringen, das Netzwerk zu lesen
Um die Idee des Satz-als-Netzwerks zu nutzen, verwendet die Studie eine Klasse von neuronalen Netzen, die für Graphen entwickelt wurden, sogenannte Graph Convolutional Networks. Bevor das Graphmodell läuft, erzeugt eine weitere KI-Komponente (vergleichbar mit weit verbreiteten Systemen wie BERT) eine dichte numerische Repräsentation jedes Wortes, die seine Bedeutung im Kontext widerspiegelt. Das Graphnetz leitet dann Informationen entlang der Verbindungen zwischen Wörtern weiter und vermischt Bedeutung und Struktur zu einer einzigen zusammenfassenden Repräsentation des gesamten Textabschnitts. Diese Zusammenfassung wird in eine abschließende Schicht eingespeist, die einen kontinuierlichen Lesbarkeitswert ausgibt statt einer einfachen Einstufung, wodurch feinere Unterschiede zwischen Texten möglich werden.
Um die beste Leistung aus dem System herauszuholen, nutzen die Autorinnen und Autoren Bayesianische Optimierung, eine Strategie, die automatisch nach guten Einstellungen vieler „Regler" gleichzeitig sucht. Dazu gehören etwa, wie stark verschiedene Wortarten die Verbindungsstärke beeinflussen sollen, wie viele Graphschichten zu verwenden sind und wie schnell das Modell lernen soll. Anstatt diese Entscheidungen manuell abzustimmen, testet und verfeinert das Optimierungsverfahren sie systematisch anhand von Validierungsergebnissen.

Wie gut es in der Praxis funktioniert
Das Modell wird auf dem CLEAR-Datensatz getestet, einer großen Sammlung von etwa 5.000 kurzen Textabschnitten mit von Expertinnen und Experten vergebenen Lesbarkeitswerten und inhaltlichen Alterskennzeichnungen (G, PG, PG-13 und R). Mit einem rigorosen Kreuzvalidierungsschema erklärt das System etwa 97 % der Variation dieser Werte, ein Genauigkeitsniveau, das sowohl klassische merkmalsbasierte Methoden als auch starke moderne Baselines, die allein auf Transformer-Modellen beruhen, übertrifft. Die Methode schlägt sich auch gut, wenn sie auf einen persischen Datensatz angewandt wird, der ursprünglich zur Klassifikation von Texten in leicht, mittel und schwer erstellt wurde: Textabschnitte derselben Schwierigkeitsgruppe erhalten tendenziell ähnliche vorhergesagte Werte, was darauf hindeutet, dass das Modell Gelernte zur Struktur in Englisch auf eine andere Sprache übertragbar ist.
Was das für den Unterricht bedeutet
Für Lehrkräfte und Curriculumentwickler ist die wichtigste Erkenntnis, dass Lesbarkeit mehr ist als nur lange Wörter und lange Sätze. Die Art und Weise, wie Informationen durch einen Satz gefädelt werden — die Anzahl der Umwege und die Art der Wörter, die diese füllen — spielt eine zentrale Rolle dabei, wie leicht Schülerinnen und Schüler folgen können. Indem Texte als Netzwerke verbundener Wörter modelliert und graphbasierte KI verwendet wird, um diese Netzwerke zu lesen, bietet die Studie ein präziseres, flexibleres Instrument zur Einschätzung der Leseschwierigkeit. Obwohl es nicht die menschliche Beurteilung ersetzt oder jede Nuance von Literatur- und Sozialwissenschaftstexten erfasst, kann es als starkes Entscheidungsinstrument dienen und Lehrenden helfen, Texte auszuwählen und anzupassen, die besser zu den Fähigkeiten ihrer Schüler passen und inklusiveres Lernen unterstützen.
Zitation: Zhang, L., Abhani, J., B, J. et al. Automatic text readability assessment for educational content based on graph representation learning. Sci Rep 16, 11308 (2026). https://doi.org/10.1038/s41598-026-41313-9
Schlüsselwörter: Lesbarkeitsbewertung, Lehrtexte, Graph-Neuronale Netze, Verarbeitung natürlicher Sprache, Textschwierigkeit