Clear Sky Science · ru
Ансамблевый подход на основе нечеткой временной серии для точного прогнозирования рейтингов вузов
Почему завтрашние рейтинги колледжей важны уже сегодня
Для многих семей выбор университета похож на ставку на неопределённое будущее. Глобальные потрясения, такие как пандемия COVID‑19, могут внезапно нарушить студенческую жизнь, финансирование и научную работу, из‑за чего привычные таблицы рейтингов непредсказуемо скачут из года в год. В этом исследовании предложен новый способ прогнозирования таких рейтингов, который старается учитывать, а не игнорировать эту неопределённость — чтобы студенты, родители и политики могли принимать решения, опираясь на реалистичные, ориентированные в будущее ожидания, а не на статичные снимки настоящего.
Почему рейтинги превратились в подвижную цель
Международные таблицы вроде Shanghai Rankings, QS и Times Higher Education влияют на всё: от подачи заявлений студентами до распределения государственных средств. Они учитывают такие показатели, как качество преподавания, научная активность, результаты студентов и международная представленность. Но пандемия обнаружила хрупкость этих мер: число зачислений упало, лаборатории закрывались, цифровая инфраструктура оказалась на пределе, а ограничения на поездки подорвали международную активность. Традиционные методы прогнозирования предполагают, что будущее похоже на прошлое, с устойчивыми шаблонами и равномерными трендами. Когда эти предположения рушатся — как это произошло во время COVID — прогнозы могут вводить в заблуждение, скрывая риски для вузов и для студентов, которые ориентируются на рейтинги при выборе места обучения.

Включая неопределённость в расчёт
Авторы предлагают метод, который рассматривает рейтинги не как фиксированные точки, а как нечеткие, изменчивые величины. Вместо того чтобы назначать каждому университету одно точное число, модель распределяет ранг по нескольким перекрывающимся диапазонам, признавая, что учреждение может находиться на границе между уровнями или проявлять повышенную волатильность в годы кризисов. Последним данным, особенно относящимся к периоду пандемии, придаётся больший вес, чем далёкой истории, что отражает идею: события прошлого года важнее для завтрашнего дня, чем события десятилетней давности. Такой «нечеткий» взгляд фиксирует двусмысленность и краткосрочные шоки таким способом, каким чёткие усреднения не справляются.
Кластеризация похожих траекторий и отбрасывание слабых предсказателей
Чтобы превратить эту более размытую картину в конкретные прогнозы, модель группирует университеты с похожими траекториями рейтингов во времени, включая отдельные кластеры для пандемийных лет, когда многие учреждения переживали резкие падения или подъёмы. Внутри каждого кластера обучаются отдельные прогнозные модули, каждый из которых учится на слегка отличающемся историческом срезе. Специальный шаг по «обрезке» затем отбрасывает самые слабые и нестабильные из этих модулей, оставляя лишь наиболее надёжные и объединяя их выводы. Такой ансамблевый подход снижает риск того, что один чрезмерно уверенный модельный компонент или один странный год данных будет доминировать в прогнозе.
Тестирование модели на образовании и за его пределами
Исследователи оценили свой подход на данных глобального рейтинга Shanghai за период с 2008 по 2021 год, охватывающем как доковидные, так и послековидные годы. Они также испытали метод на других временных рядах — например, ценах акций, измерениях морского льда, качестве воздуха и зачислениях студентов — чтобы проверить, справляется ли метод с очень разными типами неопределённости. Во всех этих случаях их ансамбль последовательно давал более точные прогнозы, чем несколько устоявшихся техник нечетких временных рядов. Для университетских рейтингов модель снизила среднюю процентную ошибку примерно до 7% и правильно предсказывала направление изменения ранга — поднимется ли университет или опустится — более чем в 80% случаев.

От более точных прогнозов к более справедливым решениям
Проще говоря, исследование показывает: можно построить прогноз рейтинга, который «знает, чего не знает». Явно моделируя двусмысленность, внезапные шоки и больший вес недавних событий, предложенная система даёт более надёжные представления о направлении развития университетов, а не только о том, где они были. Это помогает семьям не реагировать чрезмерно на единичные провалы, направляет вузы при принятии решений об инвестициях в цифровую готовность или научные сильные стороны и информирует публичные усилия по расширению качественного образования и снижению неравенства. Хотя никакая модель не сделает рейтинги полностью предсказуемыми, эта работа показывает, что их можно прогнозировать честно по отношению к неопределённости — и полезнее для людей, от чьего будущего они зависят.
Цитирование: Agarwal, N., Tayal, D.K., Rajeena, P.P.F. et al. A fuzzy time-series driven ensemble approach for accurate forecasting of higher education rankings. Sci Rep 16, 13329 (2026). https://doi.org/10.1038/s41598-026-40570-y
Ключевые слова: рейтинги университетов, прогнозирование в образовании, нечеткие временные ряды, влияние COVID-19, ансамблевое обучение