Clear Sky Science · ru
Объяснимая ИИ в образовании: интеграция предметных знаний в модель глубокого обучения для улучшения предсказаний успеваемости учащихся
Почему важны более продуманные прогнозы по ученикам
Школы все чаще обращаются к искусственному интеллекту, чтобы выявлять учеников, которым может грозить отставание, и тех, кому требуется дополнительная поддержка. Но когда такие системы ведут себя как запечатанные «черные ящики», они могут выделять странные зависимости — например, приписывать романтической жизни подростка большую значимость, чем времени на учёбу — что заставляет учителей и родителей сомневаться в достоверности результатов. В этой статье показано, как построить систему прогнозирования успеваемости, которая не только даёт более точные предсказания по математике, но и «аргументирует» их способами, согласующимися с десятилетиями исследований в области образования.
От сырых данных к тревожным сигналам
Авторы работали с хорошо известным публичным набором данных о 395 португальских старшеклассниках, для каждого из которых было собрано 30 характеристик. Они варьировались от базовой демографии (возраст, пол, размер семьи) до школьных показателей (время на учёбу, пропуски, дополнительные занятия) и аспектов социальной жизни и благополучия (отношения в семье, свободное время, прогулки с друзьями). Цель заключалась в прогнозе итоговой оценки по математике и последующем распределении учащихся по трём практическим категориям: вероятно провалит, на правильном пути, или показывает отличные результаты. Для улавливания тонких закономерностей между всеми этими факторами была обучена модель глубокого обучения — искусственная нейронная сеть (ANN).

Когда «чёрный ящик» ошибается
Хотя исходная ANN продемонстрировала достойную точность, более внимательный анализ выявил тревожные моменты. С помощью современной техники объяснения, известной как SHAP, авторы исследовали, на какие признаки модель опирается в большей степени. Некоторые из сильнейших сигналов расходились с устоявшимися результатами педагогических исследований. Например, на вид особенно влиятельными оказывались школа, в которой учится ученик, его романтическое положение и частота прогулок, тогда как факторы, подкреплённые исследованиями — образование родителей, работа матери, раннее посещение детского сада, размер семьи и еженедельное время на учёбу — получали удивительно малый вес. Такие несоответствия указывали на то, что ANN зацепилась за особенности именно этого набора данных, а не за связи, которые преподаватели считают значимыми и справедливыми.
Обучение сети тому, что уже известно педагогам
Чтобы привести модель в соответствие с образовательными представлениями, авторы предложили новую стратегию обучения, названную алгоритмом объяснения прогнозов успеваемости учащихся (Students’ Performance Prediction Explanation, SPPE). Сначала они проанализировали литературу по образованию и разделили признаки на две примерные группы: те, которые последовательно связаны с успехом (например, время на учёбу, образование родителей, стремление к высшему образованию), и те, которые являются более слабыми или сомнительными предикторами (такие как романтическое положение или обобщённые оценки семейных отношений). В ходе обучения SPPE аккуратно направляет нейронную сеть к увеличению зависимости от первой группы и ослаблению влияния второй. Это достигается путем мониторинга вклада каждого признака в предсказания и добавления мягкого штрафа всякий раз, когда выученная сетью картина значимости уходит вразрез с этими предметными знаниями.

Более ясные объяснения и более точные прогнозы
После корректировок по SPPE внутренние «мотивы» модели стали соответствовать ожиданиям педагогов. На вершину важности поднялись время на учёбу, социальный фон родителей, размер семьи и раннее обучение, в то время как идентичность школы, прогулки и романтические отношения утратили доминирующее влияние. Не менее важно, что такая перестройка не привела к потере точности — она её повысила. При классификации учащихся по трём категориям улучшенная сеть правильно определяла примерно две трети учеников, по сравнению с чуть более чем одной третью у исходной модели. Стандартные метрики точности, полноты и объединённый F1-скор заметно выросли, а статистические тесты подтвердили, что улучшения вряд ли объясняются случайностью. Авторы также показали, что та же стратегия SPPE улучшает несколько других архитектур нейронных сетей, что указывает на устойчивость подхода, а не на разовую хитрость.
Что это значит для классов и ИИ
Для педагогов и политиков исследование предлагает выход из неприятного выбора между точными, но непрозрачными моделями и прозрачными, но слабыми. Встраивая человеческую экспертизу непосредственно в процесс обучения, SPPE даёт прогнозы, которые одновременно более надёжны и легче объяснимы: на первое место выходят время, посвящённое учёбе, и долгосрочные образовательные амбиции, а не школа, в которую случайно попал ученик. Хотя работа сосредоточена на одном наборе данных по математике из Португалии, более широкая мысль такова: объяснимая ИИ, направляемая знанием предметной области, может способствовать более справедливым и обоснованным решениям о поддержке учащихся — при условии, что локальный контекст и экспертное суждение будут учтены с самого начала.
Цитирование: Qiang, M., Liu, Z. & Zhang, R. Explainable AI in education: integrating educational domain knowledge into the deep learning model for improved student performance prediction. Sci Rep 16, 9515 (2026). https://doi.org/10.1038/s41598-026-40538-y
Ключевые слова: прогноз успеваемости студентов, объяснимая ИИ, аналитика образовательных данных, нейронные сети в образовании, интеграция предметных знаний