Clear Sky Science · ru

Прогнозирование болезни Альцгеймера с помощью глубокого обучения и интерпретируемого отбора признаков на основе XAI из данных экспрессии генов в крови

2026-02-10 · Назад к списку

Почему это исследование важно

Болезнь Альцгеймера постепенно лишает людей памяти и независимости, однако наиболее точные на сегодня тесты часто требуют сканирования мозга или спинномозговой пункции — процедур дорогих, инвазивных и трудных для повторения. В этом исследовании рассматривается менее болезненная альтернатива: анализ простой пробы крови и продвинутые вычислительные методы для выявления шаблонов в активности генов, указывающих на болезнь Альцгеймера, что потенциально может обеспечить более раннюю и доступную диагностику.

Анализ крови вместо сканирования мозга

Авторы сосредоточились на незначительных изменениях в том, как гены включаются или выключаются в клетках крови. Современные лабораторные чипы могут измерять активность тысяч генов одновременно, формируя огромную таблицу чисел для каждого человека. Сложность в том, что измерений генов гораздо больше, чем пациентов, что легко может ввести компьютерные модели в заблуждение. Чтобы обойти это, исследователи объединили три большие публичные базы данных образцов крови пациентов с Альцгеймером и здоровых добровольцев, создав интегрированный ресурс с более чем двенадцатью тысячами общих генов, измеренных у сотен людей.

Обучение компьютеров выделять ключевые сигналы тревоги

Вместо того чтобы просить алгоритм обработать все двенадцать тысяч генов, команда сначала научила его отбирать гораздо меньший набор особенно информативных. Они сравнили несколько способов этого отбора, включая простые статистические тесты, методы поэтапного исключения наименее полезных генов и подходы, встроенные непосредственно в модель. Эти инструменты «отбора признаков» сузили список до нескольких сотен или чуть более тысячи генов, которые лучше всего различали пациентов и здоровые контрольные образцы. Уменьшенные наборы генов помогли избежать запоминания шумов моделью и улучшили её работу на невидимых данных.

Понимание черного ящика

Чтобы не слепо доверять предсказанию «черного ящика», исследователи применили методы объяснимого искусственного интеллекта, чтобы понять, какие гены имеют наибольшее значение и как они влияют на каждое решение. Метод под названием SHAP, заимствованный из теории игр, оценивает вклад каждого гена в итоговый результат для каждого человека. Применив его к своим моделям с наилучшими результатами, авторы выделили ядро генов, чьи шаблоны активности последовательно склоняли весы в сторону классификации как «Альцгеймер», так и «здоровый». Многие из этих генов уже связывают с здоровьем мозга или функциями иммунной системы, что придаёт биологическую достоверность внутренней логике модели.

Усиление данных с помощью синтетических пациентов

Даже после объединения наборов данных число реальных образцов крови оставалось умеренным. Чтобы укрепить модели, авторы обучили специализированный тип нейронной сети, известный как генеративно-состязательная сеть, создавать реалистичные синтетические профили экспрессии генов, похожие на профили реальных пациентов. Эти искусственные образцы добавлялись только в обучающую выборку и никогда не использовались в тестовой, чтобы проверки производительности оставались честными. С таким расширенным обучающим пулом и тщательно отобранными генами глубокая нейронная сеть смогла выявлять случаи Альцгеймера с приблизительно 91% общей точностью и 95% точностью по положительному прогнозу, то есть очень немногие здоровые люди были ошибочно помечены как больные.

Что эти результаты значат для пациентов

Эта работа показывает, что в будущем тест на основе крови для болезни Альцгеймера, работающий с помощью интеллектуальных алгоритмов, которые одновременно отбирают и объясняют ключевые генетические сигналы, может дополнять или даже уменьшать зависимость от дорогостоящих сканирований и инвазивных процедур. Хотя необходима дополнительная валидация на независимых группах пациентов, а также лучшее контролирование различий между лабораторными методами, исследование демонстрирует, что объединение нескольких наборов данных, удаление нерелевантной информации и раскрытие «черного ящика» ИИ могут приблизить нас к практическому, интерпретируемому тесту крови для более раннего и более комфортного выявления Альцгеймера.

Цитирование: Hariharan, J., Jothi, R. Alzheimer’s disease prediction using deep learning and XAI based interpretable feature selection from blood gene expression data. Sci Rep 16, 8022 (2026). https://doi.org/10.1038/s41598-026-35260-8

Ключевые слова: диагностика болезни Альцгеймера, биомаркеры крови, экспрессия генов, глубокое обучение, объяснимая ИИ