Clear Sky Science · ru

Объяснимая система искусственного интеллекта для прогнозирования ишемической болезни сердца с использованием улучшенного отбора признаков методом белки-летяги

2026-04-01 · Назад к списку

Почему важны более умные проверки сердца

Сердечные заболевания по‑прежнему остаются главной причиной смертности в мире, но врачам часто приходится располагать ограниченным временем, множеством результатов тестов и сложными компьютерными инструментами. В этом исследовании показано, как легко объяснимая система искусственного интеллекта может помочь врачам вовремя выявлять ишемическую болезнь сердца, одновременно делая свои рассуждения понятными. Вместо того чтобы прятать решения в «черном ящике», система выделяет несколько наиболее важных измерений, помогая клиницистам использовать компьютерную поддержку, не теряя доверия и контроля.

Figure 1. Система ИИ на основе ключевых медицинских тестов помогает врачам быстро оценивать риск сердечных заболеваний у пациента.

Проблемы сердца и данные, стоящие за ними

Ишемическая болезнь сердца возникает, когда кровоток к сердцу уменьшается, часто из‑за закупорки артерий. Врачи рассматривают множество факторов, таких как возраст, артериальное давление, уровень холестерина, стенокардия и результаты обследований сердца. Использованный в работе набор данных UCI Heart Disease содержит 303 карточки пациентов с 13 такими факторами и меткой, указывающей на наличие или отсутствие болезни. Хотя такое разнообразие помогает в прогнозировании, слишком много перекрывающихся или нерелевантных измерений может запутать людей и компьютеры, замедлить анализ и иногда снизить точность.

Очистка и упрощение медицинской карточки

Прежде чем машина сможет учиться на данных, сырые записи нужно очистить и привести в нужный формат. Исследователи заполнили пропущенные значения методом, заимствующим информацию у схожих пациентов, масштабировали все измерения к общему диапазону, перевели категориальные признаки, такие как тип болей в груди, в числовую форму и внимательно проверили необычные значения, чтобы отличить реальные экстремальные случаи от вероятных ошибок. Они также уравновесили число больных и здоровых пациентов, сгенерировав реалистичные дополнительные примеры для меньшей группы, и удалили признаки, почти дублирующие друг друга. В результате получена аккуратная таблица, где каждый столбец информативен и готов к анализу.

Как белки-летяги вдохновляют отбор признаков

Ключевая идея исследования в том, что компьютеру не нужны все доступные измерения для хорошего прогноза. Вместо этого стоит автоматически искать небольшую группу наиболее информативных признаков. Для этого авторы используют оптимизационный метод, вдохновленный тем, как белки‑летяги ищут еду в лесу. В их улучшенной процедуре поиска по образцу белки‑летяги каждая «белка» представляет собой возможное подмножество признаков, а группа вместе «скользит» по пространству поиска, корректируя движения при застое прогресса. Наилучшие комбинации сохраняются и уточняются в поиске минимального набора измерений, который при этом обеспечивает высокую точность решений.

Figure 2. Отобранные измерения сердечных тестов проходят через объяснимую модель, которая разделяет пациентов на здоровых и находящихся в группе риска.

Обучение модели и раскрытие «черного ящика»

После того как поиск, вдохновлённый белками‑летягами, отбирает оптимальный набор признаков, обучается модель случайного леса для прогнозирования наличия болезни. Случайный лес объединяет голоса множества слегка отличающихся деревьев решений, что делает итоговый прогноз устойчивым к шуму в данных. На выбранных признаках модель достигает примерно 96–98% точности и очень высокой способности разделять больных и здоровых пациентов. Чтобы сделать логику понятной, исследователи применили два инструмента объяснения. SHAP показывает, какие факторы наиболее влиятельны в масштабах всего набора данных, а LIME фокусируется на отдельных пациентах, показывая, как их конкретные значения смещают прогноз в сторону более высокого или более низкого риска.

Что это значит для пациентов и врачей

Проще говоря, исследование создает помощника для прогнозирования сердечных заболеваний, который одновременно точен и объясним. Сократив входные данные до нескольких ключевых измерений и представив ясные визуальные объяснения, система может сказать врачу не только то, что пациент, вероятно, страдает ишемической болезнью сердца, но и какие именно находки — например, определённый результат обследования или изменение при физической нагрузке — формируют такое заключение. Такое сочетание точности, простоты и прозрачности делает подход более пригодным для реальных клиник, и в будущем его можно расширить на крупные больницы и более богатые источники данных, такие как носимые устройства и визуализационные исследования.

Цитирование: Cenitta, D., Arul, N., Arjunan, R.V. et al. An explainable artificial intelligence framework for ischemic heart disease prediction using enhanced squirrel search feature selection. Sci Rep 16, 15422 (2026). https://doi.org/10.1038/s41598-026-46823-0

Ключевые слова: ишемическая болезнь сердца, объяснимый ИИ, прогнозирование сердечных заболеваний, отбор признаков, случайный лес