Clear Sky Science · ru

Автоматическая оценка читаемости учебных материалов на основе обучения представлений графов

· Назад к списку

Почему это важно для учителей и учащихся

Когда учителя выбирают текст для чтения, им приходится сохранять тонкий баланс: материал должен быть достаточно сложным, чтобы способствовать развитию, но не настолько трудным, чтобы учащиеся сдались. В этой статье представлен новый метод искусственного интеллекта, который может оценивать, насколько трудно читать тот или иной отрывок, в особенности учебные материалы. Отходя от простых подсчётов слов и предложений в сторону глубинной структуры языка, система стремится точнее подбирать подходящий текст для конкретного читателя по сравнению с традиционными формулами читаемости.

Ограничения устаревших показателей читаемости

Десятилетиями в школах использовали формулы вроде Flesch–Kincaid, которые опираются на поверхностные признаки — длину предложений и число слогов — для оценки сложности. Эти методы легко вычислять, но они не видят многих аспектов реальной сложности. Короткий научный абзац, насыщенный терминологией, или предложение со сложной конструкцией могут по‑прежнему отмечаться как «простой», потому что слова короткие, а предложения недлинные. В результате учителя непреднамеренно могут назначать материал, который окажется слишком плотным для некоторых учеников или чрезмерно простым для других, особенно по предметам, богато насыщенным содержанием, таким как естественные и общественные науки.

Взгляд внутрь предложения

Авторы предлагают иной подход, который рассматривает каждое предложение как сеть. Каждое слово становится точкой (узлом), а грамматические связи между словами — например «подлежащее–сказуемое» или «сказуемое–дополнение» — превращаются в связи (рёбра). Важный момент: прочность каждой связи зависит не только от расстояния в предложении, но и от того, какие слова находятся между ними. Длинный отрезок, заполненный содержательными словами — существительными, глаголами и прилагательными, — предполагает ментально более затратный скачок; короткий путь или путь, в основном состоящий из служебных слов, указывает на более простой переход. Психолингвистические исследования показывают, что такие длинные, насыщенные содержанием обходные пути нагружают рабочую память и замедляют понимание, поэтому модель использует их как сигнал повышенной сложности.

Figure 1
Figure 1.

Обучение сети читать сеть

Чтобы использовать идею «предложение как сеть», исследование применяет тип нейронной сети, предназначенный для графов — графовую сверточную сеть (Graph Convolutional Network). До того как графовая модель запустится, другой модуль ИИ (по устройству близкий к широко используемым системам вроде BERT) создаёт богатое числовое представление каждого слова, отражающее его значение в контексте. Затем графовая сеть передаёт информацию по связям между словами, сочетая смысл и структуру в единое сводное представление всего отрывка. Это сводное представление поступает в финальный слой, который выдаёт непрерывный показатель читаемости вместо простого диапазона оценок, что позволяет точнее различать тексты.

Чтобы добиться наилучшей работы системы, авторы применяют байесовскую оптимизацию — стратегию, которая автоматически ищет хорошие настройки множества «ручек» одновременно. К ним относятся, например, насколько сильно разные части речи должны влиять на силу связи, сколько графовых слоёв использовать и с какой скоростью модель должна обучаться. Вместо ручной подстройки эти параметры систематически тестируются и уточняются процедурой оптимизации на основе валидационных результатов.

Figure 2
Figure 2.

Насколько это работает на практике

Модель протестирована на наборе данных CLEAR — большой коллекции примерно из 5000 коротких отрывков с экспертно присвоенными оценками читаемости и киноподобными рейтинги контента (G, PG, PG-13 и R). Используя строгую схему перекрёстной проверки, система объясняет около 97% разброса в этих оценках, что представляет собой уровень точности, превосходящий как классические методы на основе признаков, так и сильные современные базовые модели, построенные только на трансформерах. Метод также показывает хорошие результаты при применении к персидскому набору данных, изначально созданному для классификации текстов по уровням «лёгкий», «средний» и «трудный»: отрывки внутри одной группы сложности получают похожие предсказанные оценки, что указывает на переносимость того, что модель учится о структуре в английском, на другой язык.

Что это значит для классных комнат

Для преподавателей и разработчиков учебных программ главный вывод в том, что читаемость — это не только длинные слова и длинные предложения. То, как информация проходит через предложение — число обходных путей и типы слов, которые их заполняют, — играет важную роль в том, насколько легко учащимся следовать за мыслью. Модель, которая представляет тексты как сети связанных слов и использует графовый ИИ для «чтения» этих сетей, предлагает более точный и гибкий инструмент для оценки сложности чтения. Она не заменяет человеческое суждение и не учитывает все нюансы художественных или общественно-научных текстов, но может служить мощным вспомогательным средством, помогая учителям выбирать и адаптировать тексты, лучше соответствующие навыкам учеников и поддерживающие более инклюзивное обучение.

Цитирование: Zhang, L., Abhani, J., B, J. et al. Automatic text readability assessment for educational content based on graph representation learning. Sci Rep 16, 11308 (2026). https://doi.org/10.1038/s41598-026-41313-9

Ключевые слова: оценка читаемости, учебные тексты, графовые нейронные сети, обработка естественного языка, сложность текста