Clear Sky Science · ru
Использование универсальных и трансферных моделей обучения для прогнозирования гриппа в Таиланде
Почему прогнозы гриппа важны для всех
Грипп может восприниматься как обычное зимнее заболевание, но он ежегодно отправляет миллионы людей в клиники и больницы и может быть смертельным, особенно когда системы здравоохранения оказываются не готовы. Возможность предсказать, когда и где ожидается всплеск заболеваемости, позволяет врачам и чиновникам по охране здоровья запасти вакцины и лекарства, подготовить койки в больницах и заранее предупредить население. Это исследование сосредоточено на Таиланде, но лежащие в его основе идеи — использование современных методов искусственного интеллекта для улучшения прогнозов даже при скудных данных — могут помочь многим странам подготовиться к следующему тяжелому сезону гриппа.

Грипп, погода и фрагментарные данные
Нагрузка гриппа в Таиланде сильно варьирует по провинциям, и предыдущие исследования показали, что локальный климат — такие факторы, как температура, влажность, осадки и загрязнение воздуха — влияет на момент и силу вспышек. К сожалению, подробные измерения погоды и качества воздуха доступны не повсеместно. Из 76 провинций Таиланда только в 22 имеются одновременно данные о случаях гриппа и сопутствующие экологические данные; в остальных сохранены лишь числа случаев. Традиционные статистические инструменты, которые часто настраиваются отдельно для каждой территории, испытывают трудности с такой «пятнистой» картиной. Они могут пропускать необычные паттерны и медленно адаптироваться при изменении условий, что ограничивает их полезность для общенационального раннего предупреждения.
Создание одной модели для множества мест
Исследователи поставили цель создать единую «универсальную» модель, которая могла бы обучаться на данных всех 22 провинций с полными наблюдениями одновременно. Они использовали искусственную нейронную сеть — вид глубокого обучения, который в общих чертах имитирует то, как нервные клетки обрабатывают информацию, — чтобы прогнозировать ежемесячную заболеваемость гриппом за период 2010–2019 годов. Перед обучением сети применили метод машинного обучения Random Forest для отбора из 27 кандидатов на вход: текущих и запаздывающих значений температуры, влажности, осадков, ветра, видимости, загрязнения воздуха и недавних уровней гриппа. Этот шаг выявил, какие переменные действительно улучшают прогнозы, и позволил авторам исключить менее полезные факторы, сделав итоговую модель быстрее и менее чувствительной к шуму.
Чему научилась универсальная модель
После обширного тестирования разных архитектур сеть с относительно простой конфигурацией — один скрытый слой с 128 внутренними узлами — показала наилучшие результаты. Любопытно, что добавление экологических факторов, таких как погода и загрязнение воздуха, лишь слегка улучшало прогнозы в большинстве провинций и в некоторых случаях оказывало несущественное влияние. Одним явным сигналом оказалось влияние температуры: она последовательно отбиралась как важный фактор, что согласуется с ранними работами, связывавшими более низкие или меняющиеся температуры с повышенной активностью гриппа. По 22 провинциям универсальная модель улавливала общий подъем и спад заболеваемости, но имела склонность недооценивать самые высокие пики, особенно в крупных городах вроде Бангкока и в северных провинциях с высокой заболеваемостью.

Обучение модели для помощи регионам с дефицитом данных
Реальная сложность заключалась в прогнозировании гриппа в оставшихся 54 провинциях, где отсутствовали подробные экологические данные. Здесь команда применила трансферное обучение — технику, при которой модель, обученная на одной задаче, адаптируется к смежной. Сначала они обучили универсальную нейронную сеть на 22 хорошо измеренных провинциях. Затем модель перестроили так, чтобы она могла работать только на основе прошлых данных о случаях гриппа. Наконец, эту адаптированную модель донастраивали двумя способами: один раз на объединенных данных всех 54 провинций и отдельно для каждой провинции. По-настоящему лучший результат показал подход с донастройкой по каждой провинции: он уменьшил ошибки прогнозов и дал более близкое соответствие наблюдаемым тенденциям по сравнению и с объединенным подходом, и с простым базовым методом, опирающимся исключительно на прошлые локальные уровни гриппа.
Что это значит для планирования на будущее
Для неспециалиста главный вывод прост: одна хорошо спроектированная модель ИИ способна усвоить общие закономерности поведения гриппа в одной части страны и затем быть использована для улучшения прогнозов в других местах, даже там, где поддерживающие данные скудны. В Таиланде лучшая версия этого подхода — сравнительно небольшая нейронная сеть, донастроенная для каждой провинции — предсказала местные тенденции заболеваемости точнее стандартных методов. Хотя модель по-прежнему недооценивает масштаб экстремальных вспышек и пока не включает социальные или экономические факторы, она предлагает практический план для стран с низким и средним уровнем дохода: начать с районов, где данные богаты, перенести эти знания в области с дефицитом данных и использовать такие прогнозы для планирования вакцинации, укомплектования персоналом и других мер защиты до наступления следующей волны.
Цитирование: Lueangwitchajaroen, P., Anupong, S., Winalai, C. et al. Leveraging universal and transfer learning models for influenza prediction in Thailand. Sci Rep 16, 6668 (2026). https://doi.org/10.1038/s41598-026-37855-7
Ключевые слова: прогнозирование гриппа, трансферное обучение, глубокое обучение, прогнозирование эпидемий, общественное здравоохранение Таиланда