Clear Sky Science · ru
Объяснимая машинная обучаемость для прогнозирования долгосрочного риска сердечно-сосудистых заболеваний у китайских людей среднего и старшего возраста: 9‑летнее продольное когортное исследование с веб-калькулятором риска
Почему важно прогнозирование сердечного риска
Сердечно‑сосудистые заболевания сейчас являются ведущей причиной смерти в Китае, особенно среди людей среднего и пожилого возраста. При этом большинство инструментов, которые врачи используют для оценки будущего риска сердечных заболеваний и инсульта, были созданы на данных западных популяций и плохо подходят для китайских взрослых. В этом исследовании ставился вопрос, могут ли современные методы искусственного интеллекта дать более точные, но при этом понятные, долгосрочные оценки риска, адаптированные к китайским взрослым в возрасте 45 лет и старше.
Национальный обзор стареющих сердечно‑сосудистых рисков
Исследователи использовали данные China Health and Retirement Longitudinal Study — крупного продолжающегося исследования, которое отслеживает десятки тысяч людей, проживающих в сообществах в большинстве провинций. Из этого ресурса они отобрали 8 080 человек в возрасте не менее 45 лет, у которых при включении в исследование в 2011 году не было сердечно‑сосудистых заболеваний. За этими участниками вели наблюдение в течение девяти лет, чтобы зафиксировать новые случаи сердечных заболеваний и инсульта. Команда начала с 77 показателей, которые легко собрать в клинике, включая возраст, регион, перенесённые болезни, симптомы настроения, режим сна, антропометрию и результаты анализов крови. С помощью стандартных статистических проверок этот набор сократили до 11 ключевых факторов, которые одновременно практичны для измерения и тесно связаны с последующими сердечно‑сосудистыми событиями.

Обучение компьютеров распознавать закономерности
Далее исследователи протестировали десять различных методов компьютерного прогнозирования — от традиционной логистической регрессии до более гибких подходов, таких как случайные леса, градиентный бустинг и нейронные сети. Участников разделили на обучающую группу, использованную для построения каждой модели, и отдельную валидационную группу для проверки того, как модели работают на новых людях. Оценивали производительность по тому, насколько точно каждый метод отделял тех, у кого впоследствии развились сердечно‑сосудистые заболевания, от тех, кто оставался здоровым, насколько предсказанные риски соответствовали фактическим частотам событий и насколько полезны были прогнозы в реальных решениях о том, кому следует предложить дополнительные профилактические меры.
Какие повседневные факторы оказались важнее всего
Метод случайного леса показал лучшие результаты, достигнув высокой точности и наилучшего баланса между выявлением людей с высоким риском и минимизацией ложных тревог. Чтобы раскрыть внутренний механизм этого метода, команда использовала приём объяснения SHAP, который присваивает каждому фактору вклад в итоговый прогноз. Анализ показал, что окружность талии была самым влиятельным фактором: каждый лишний сантиметр талии заметно повышал риск за девять лет, подчёркивая значимость абдоминального жира в этой популяции. Высокий уровень триглицеридов, старший возраст и в анамнезе высокое артериальное давление также были главными драйверами риска, в то время как более высокий уровень защитного ЛПВП‑холестерина связывался с более низким риском. Интересно, что настроение и режим сна несли независимую информацию: более высокие баллы по депрессии и недостаточная или чрезмерная продолжительность ночного сна оба сдвигали риск вверх даже после учёта традиционных медицинских факторов.

От исследовательской модели к повседневному инструменту
Поскольку все 11 предикторов рутинно доступны в первичной медицинской помощи, команда перевела лучшую модель в простой веб‑калькулятор. Пользователь вводит возраст, регион, выбранные элементы медицинского анамнеза, окружность талии, два распространённых показателя липидов крови, оценку депрессии и обычную продолжительность сна. Инструмент затем возвращает оценку шанса этого человека развить сердечно‑сосудистое заболевание в течение следующих девяти лет. Авторы подчёркивают, что этот калькулятор предназначен для поддержки, а не замены профессионального суждения и должен использоваться вместе с полной клинической оценкой, учётом местных ресурсов и предпочтений пациента.
Что это значит для пациентов и врачей
Исследование показывает, что тщательно спроектированное и объяснимое машинное обучение может дать более точные долгосрочные оценки риска сердца и инсульта для китайских взрослых среднего и пожилого возраста по сравнению с традиционными формулами. Оно также подчёркивает, что состояние талии, липидный профиль, а также повседневные сон и настроение имеют значение для будущего сердечно‑сосудистого здоровья. Упаковывая эти выводы в бесплатный онлайн‑калькулятор, работа предлагает муниципальным клиникам и отдельным людям недорогой способ раньше выявлять людей с повышенным риском и направлять индивидуализированные стратегии профилактики, оставляя окончательные решения в руках клиницистов.
Цитирование: Zhu, XY., Li, W., Pan, XY. et al. Explainable machine learning for long-term cardiovascular disease risk prediction in Chinese middle-aged and older adults: a 9-year longitudinal cohort study with web-based risk calculator. Sci Rep 16, 14998 (2026). https://doi.org/10.1038/s41598-026-45297-4
Ключевые слова: сердечно‑сосудистые заболевания, машинное обучение, прогнозирование риска, окружность талии, китайские взрослые