Clear Sky Science · ru

Модели машинного обучения для прогнозирования риска деменции: данные исследования Sydney Memory and Ageing Study

· Назад к списку

Почему это важно для здорового старения

Деменция — одно из самых пугающих состояний в пожилом возрасте, но многие люди получают диагноз только тогда, когда проблемы с памятью и мышлением уже выражены. В этом исследовании задают обнадеживающий вопрос: можно ли, используя данные, которые уже собирают клиники — например возраст, простые тесты на мышление, уровень сахара в крови и параметры сердечно-сосудистого здоровья — выявить тех, кто с большей вероятностью разовьёт деменцию за срок до десяти лет? Если да, врачи могли бы сосредоточить наблюдение и профилактические усилия на тех, кому они наиболее нужны.

Figure 1
Figure 1.

Взгляд поближе на долгое клиническое исследование старения

Исследователи опирались на Sydney Memory and Ageing Study, в котором наблюдали более тысячи австралийцев в возрасте 70 лет и старше, не имевших деменции при включении. В течение примерно десяти лет у части участников развилась деменция, у других — нет. В начале все прошли детальные тесты памяти и мышления, опросники по настроению и медицинское обследование, включая анализы крови и измерения состояния сердечно-сосудистой системы. Сравнивая, какие исходные признаки были наиболее характерны для тех, кто позднее заболел деменцией, команда могла обучить компьютерные модели распознавать профили повышенного риска.

Обучение машин распознавать будущий риск

Для создания этих инструментов прогнозирования авторы сравнили несколько распространённых методов машинного обучения. Все модели решали одинаковую задачу: исходя из исходной информации о человеке, какова вероятность того, что через десять лет у него будет диагностирована деменция, при условии, что он дожил до оценки? Алгоритмы обучали на данных примерно 70 процентов участников, а затем тестировали на оставшихся 30 процентах, которые держали в стороне как «невидимую» выборку. В качестве входных данных использовали возраст, образование, симптомы настроения, подробные когнитивные показатели, соотношение талия–бёдра, стандартную шкалу риска сердечных заболеваний и показатели крови — холестерин, триглицериды, мочевую кислоту, функцию почек, маркеры воспаления и натощаковый глюкозу. Генетический маркер риска APOE ε4 рассматривали позже как опциональное дополнение.

Четыре простых показателя несут основной сигнал

Из разных подходов лучше всех показал себя упрощённый метод LASSO-регрессии. Несмотря на большое число кандидатов, эта модель оставила только четыре предиктора: возраст, общую когнитивную результативность, натощаковую глюкозу и комбинированный показатель риска сердечно-сосудистой системы. Более старший возраст, более высокий уровень глюкозы и худший сердечно-сосудистый профиль повышали прогнозируемый риск, тогда как лучшие когнитивные показатели снижали его. В отложенной тестовой группе модель на четырёх факторах могла правильно ранжировать человека, у которого впоследствии развилась деменция, выше человека без деменции примерно в трёх четвертях случаев — уровень, считающийся приемлемым для клинических инструментов риска. Она также обеспечивала хорошее соотношение между выявлением истинных будущих случаев и избеганием излишних ложных тревог.

Figure 2
Figure 2.

Что мало что добавляет и как пользоваться инструментом

Удивительно, но добавление генетического статуса APOE ε4 в лучшую модель не улучшило её точность и даже слегка ухудшило некоторые показатели, когда в модель уже включили возраст, когнитивную результативность, уровень сахара в крови и сердечный риск. Это говорит о том, что, по крайней мере в этой когорте пожилых людей, основную информацию дают рутинные клинические данные, а не генетическое тестирование или экспериментальные маркеры в крови. Авторы приводят простую формулу, которую можно реализовать в таблице, чтобы преобразовать эти четыре показателя в оценку десятигодичного риска деменции, а затем сравнить её с предложенным порогом для классификации как «повышенный риск» или «нижний риск». Они также объясняют, как в системах здравоохранения можно скорректировать исходную вероятность, если деменция встречается чаще или реже в их популяциях или в разных возрастных группах.

Что это значит для пациентов и клиницистов

Пока что эта работа является доказательством концепции, а не готовой программой скрининга. Она показывает, что небольшой набор привычных измерений — возраст, структурированный тест на мышление, натощаковая глюкоза и стандартная шкала сердечного риска — может существенно разделить пожилых людей на группы с более низким и более высоким риском деменции вплоть до десяти лет до возможного диагноза. Прежде чем использовать модель повсеместно, её нужно проверить в других странах, с более простыми когнитивными тестами, пригодными для повседневной практики, и в условиях реальной клинической работы с учётом того, как пациенты и врачи реагируют на вероятностные оценки риска. Тем не менее вывод обнадёживает: внимание к здоровью мозга, уровню сахара в крови и сердечно‑сосудистому состоянию вместе может помочь выявить тех, кто получит наибольшую пользу от более пристального наблюдения и ранних профилактических мер.

Цитирование: Chalmers, R.A., Cervin, M., Choo, C. et al. Machine learning models for dementia risk prediction: evidence from the Sydney Memory and Ageing Study. npj Dement. 2, 27 (2026). https://doi.org/10.1038/s44400-026-00071-1

Ключевые слова: прогнозирование риска деменции, машинное обучение, когнитивное старение, кардиометаболическое здоровье, раннее выявление