Clear Sky Science · ru
Глубокое обучение для прогнозирования частоты заболеваемости и оценки радиационного риска солидных опухолей
Почему это важно в повседневной жизни
Мы все подвергаемся низким уровням радиации от медицинских обследований, авиаперелётов и окружающей среды. Регуляторы используют модели, чтобы оценить, насколько эта радиация может повысить наши шансы на развитие рака. В этом исследовании задаются вопросом, может ли современный искусственный интеллект, и в частности глубокое обучение, улучшить эти оценки по сравнению с традиционными формулами, которые в течение десятилетий задавали правила безопасности.

Уникальный долгосрочный набор данных о людях
Исследование сосредоточено на Life Span Study — долговременном исследовании более 100 000 выживших после атомных бомбардировок в Хиросиме и Нагасаки. Для каждой подгруппы участников известны полученная доза радиации, время наблюдения и число зарегистрированных солидных опухолей. Авторы используют таблицу «человеко‑лет», которая суммирует случаи рака и время подверженности риску по комбинациям возраста, возраста при облучении, пола, города и дозы. Этот богатый набор данных служил основой руководств по защите от радиации во всём мире, что делает его идеальной площадкой для испытания новых подходов к моделированию.
Старые правила против новых обучающих машин
Традиционно радиационный риск в этой когорте оценивали с помощью так называемых параметрических моделей. Они опираются на заранее выбранные математические формулы, описывающие, как риск меняется с дозой, возрастом и другими факторами. Такие модели прозрачны и относительно легко интерпретируемы, но могут ошибаться, если выбранные формулы не соответствуют реальным закономерностям в данных. Напротив, глубокие нейронные сети извлекают зависимости напрямую из данных через несколько слоёв связанных «элементов», не предполагая определённой математической формы для кривой «доза—ответ». Авторы построили нейронную сеть, которая принимает шесть входов — два показателя возраста, пол, город, место пребывания во время бомбардировки и дозу — и предсказывает частоту возникновения опухолей для каждой ячейки таблицы человеко‑лет.
Насколько хорошо глубокое обучение предсказывает частоту рака?
Команда сравнила четыре модели: простую «нулевую» модель на основе среднего, стандартную линейную модель, традиционную параметрическую модель радиационного риска и глубокую нейронную сеть. С помощью повторной перекрёстной проверки они оценивали качество по нескольким стандартным мерам ошибки. Нейронная сеть дала наименьшую ошибку по всем метрикам, но лишь немного лучше, чем продвинутая параметрическая модель. Обе продвинутые модели в целом хорошо согласовывались с наблюдаемыми показателями опухолей по возрастным группам и большинству категорий дозы, хотя каждая показывала большие расхождения при самых высоких дозах и в старших возрастах. Иными словами, глубокое обучение не дало драматического превосходства над лучшей обычной моделью в прогнозировании числа опухолей, но по крайней мере оказалось не хуже и часто немного лучше, ценой значительно больших вычислительных затрат и сложности.

Разные представления о формировании радиационного риска
Более заметное различие выявилось, когда авторы изучили избыточный относительный риск (ERR) — распространённый способ выражения того, насколько радиация умножает исходный риск рака. С помощью нейронной сети они оценили ERR для каждой ячейки, сравнивая предсказанные показатели опухолей при наличии и отсутствии дозы радиации при фиксированных остальных факторах. Хотя нейронная сеть и параметрическая модель предсказывали схожие количества опухолей, полученные значения ERR заметно различались по диапазону доз: параметрическая модель давала, как правило, более высокие и более широко разбросанные оценки ERR. Чтобы понять причину, исследователи применили SHAP‑значения — метод на основе теории игр, который распределяет вклад каждой входной переменной в предсказания модели. Для общих показателей частоты опухолей обе модели согласились, что решающими факторами являются текущий возраст, возраст при облучении, доза и пол. Но для ERR нейронная сеть выделила дозу радиации как доминирующий фактор, придавая возрасту меньшую вспомогательную роль, тогда как параметрическая модель приписывала гораздо более сильную роль возрасту при облучении и текущему возрасту из‑за заранее заданной формы своей формулы.
Ограничения, проблемы и перспективы использования
Исследование подчёркивает, что глубокое обучение, будучи гибким, по‑прежнему остаётся «чёрным ящиком» для многих пользователей. Оно не даёт в явном виде простых сводных чисел — например «увеличение риска на единицу дозы», к которым привыкли регуляторы, и оценка интервалов неопределённости для его предсказаний технически сложна, особенно при использовании суммарных данных человеко‑лет. Модели также могут переобучаться на тонкие особенности данных при недостаточном контроле и требуют значительно больше вычислительных ресурсов, чем традиционные подходы. Авторы полагают, что глубокое обучение не должно заменять тщательно разработанные параметрические модели, но может служить мощным дополнением: оно способно выявлять скрытые нелинейные закономерности или взаимодействия и подсказывать лучшие функциональные формы для более простых моделей, которые остаются легче объяснимыми и удобными для регулирования.
Что это означает для радиационной безопасности
Для неспециалиста вывод таков: современные инструменты ИИ могут сопоставляться с традиционными методами или слегка их превосходить при прогнозировании случаев рака, связанных с радиацией, в ключевом наборе человеческих данных. Однако они могут дать иную картину того, какие факторы важнее, в частности, насколько сильно возраст влияет на радиационный риск. Вместо того чтобы опровергать существующие знания, эта работа подчёркивает, как выбор модели может изменить видимую значимость дозы по сравнению с возрастом, и призывает сочетать глубокое обучение с экспертными, прозрачными моделями. В долгосрочной перспективе такой гибридный подход может поддержать более тонкие и надёжные руководства по защите от радиации в медицине, на рабочих местах и в окружающей среде.
Цитирование: Liu, Z., Nakamizo, T., Misumi, M. et al. Deep learning for incidence rate prediction and radiation risk assessment of solid tumors. Sci Rep 16, 10577 (2026). https://doi.org/10.1038/s41598-026-46756-8
Ключевые слова: риск радиации, глубокое обучение, заболеваемость раком, выжившие после атомных бомб, моделирование риска