Clear Sky Science · ru

MM-GradCAM: улучшенный мультимодальный метод GradCAM с 1D и 2D ЭКГ-данными для выявления сердечной аритмии

· Назад к списку

Почему это исследование сердца важно для вас

Нерегулярные сердечные сокращения, известные как аритмии, могут приводить к обморокам, инсультам или внезапной смерти, но часто не дают предупреждающих признаков до тех пор, пока не становится слишком поздно. Врачи полагаются на электрокардиограммы (ЭКГ) — знакомые зазубренные линии, отображающие активность сердца — чтобы обнаружить проблему. В последние годы компьютерные программы стали очень хороши в чтении этих записей, иногда не хуже специалистов. Но обычно они работают как закрытая коробка: выдают ответ, не показывая, как пришли к нему. В этом исследовании предложен новый способ сделать эти мощные инструменты более прозрачными, помогая врачам видеть, какие именно участки ЭКГ пациента повлияли на решение компьютера.

Figure 1
Figure 1.

Заглядывая внутрь «черного ящика»

Многие современные медицинские системы ИИ используют глубокое обучение — подход, который автоматически обнаруживает закономерности в данных вместо опоры на вручную заданные правила. Хотя это часто повышает точность, оно также скрывает процесс рассуждений, что вызывает серьёзные опасения, когда речь идет о жизни людей. Чтобы повысить доверие, исследователи обратились к методам «объяснимого ИИ», которые выделяют области изображения или сигнала, сильнее всего повлиявшие на решение модели. Одним из наиболее распространённых инструментов в этой области является Grad-CAM — метод, создающий тепловые карты, то есть цветовые наложения, показывающие, где алгоритм фокусировался. До сих пор такие объяснения обычно ограничивались одним типом входа, например, сырым сигналом ЭКГ или изображением, но не их сочетанием.

Два взгляда на один и тот же сердечный цикл

В этой работе авторы сосредоточились на одном широко используемом канале ЭКГ, называемом отведением II, взятом из крупной публичной базы данных более чем 10 000 пациентов. Каждая 10-секундная запись обрабатывалась двумя способами. Во-первых, она сохранялась в своей исходной одномерной форме — простой линии, отображающей напряжение во времени. Во-вторых, запись преобразовывали в градации серого — по сути, изображение с графиком ЭКГ. Для каждой формы команда построила соответствующую модель глубокого обучения на основе 17-слойной сверточной нейронной сети, популярной архитектуры для распознавания шаблонов. Одна сеть обучалась на 1D-сигнале, другая — на 2D-изображении; обе были обучены классифицировать ритмы сердца по четырём группам: нормальный ритм, медленный ритм, группа быстрых ритмов и ритмы, связанные с фибрилляцией предсердий.

Объединение двух объяснений в одно

После обучения исследователи применили Grad-CAM отдельно к модели, работающей с сигналом, и к модели, работающей с изображением. Для 1D-модели они получили цветовые сегменты вдоль линии ЭКГ, где сеть была наиболее сфокусирована. Для 2D-модели были сгенерированы тепловые карты, выделяющие «горячие» зоны на изображении ЭКГ. Новый метод, названный MM-GradCAM (мультимодальный Grad-CAM), затем выровнял эти два представления по времени и пространству и объединил их в единое объяснение. Эта унифицированная карта показывает на одном комбинированном ЭКГ-ленточном изображении и временные подсказки, и образные паттерны, которые повлияли на решение ИИ. Кардиолог просмотрел множество примеров, сопоставляя выделенные области с известными признаками различных ритмов, такими как отсутствие зубцов P при фибрилляции предсердий или очень регулярные частые комплексы при некоторых быстрых ритмах.

Figure 2
Figure 2.

Насколько хорошо система читает сердцебиение

На ранее не встречавшихся в обучении пациентах модель, работающая с изображением, правильно классифицировала ритмы примерно в 97% случаев, тогда как модель, основанная на сигнале, достигала около 93% точности. Производительность варьировала в зависимости от типа ритма: модель на изображениях в целом работала лучше, особенно для более сложных или тонких паттернов. При этом объединённые карты MM-GradCAM показали, что каждое представление вносит свою уникальную информацию. У некоторых пациентов с фибрилляцией предсердий объяснение на основе сигнала упускало ключевые участки, тогда как карта на изображении правильно фокусировалась на отрезках, где отсутствовали нормальные волновые формы. В других случаях, например при некоторых быстрых ритмах, карта, основанная на сигнале, давала более ясную и клинически оправданную картину. Предоставляя оба вида одновременно, MM-GradCAM выявлял сильные и слабые стороны, которые остались бы незаметны при использовании только одного типа входных данных.

Что это означает для будущей кардиологии

Главное послание исследования не столько в том, что компьютер умеет точно находить нарушение ритма — многие системы уже справляются с этим — сколько в том, что теперь его рассуждения можно сделать более понятными для человека-эксперта. Объединив объяснения на основе сигнала и изображения в единое согласованное представление, MM-GradCAM даёт кардиологам способ проверить, «смотрит» ли ИИ на клинически значимые участки ЭКГ. Это может повысить доверие, помочь обнаруживать ошибки и даже служить учебным инструментом для врачей в обучении чтению сложных ритмов. Хотя методу ещё предстоит пройти испытания на более разнообразных группах пациентов и в реальных клинических рабочих процессах, он указывает на будущее, в котором мощные инструменты ИИ не только дают ответы, но и ясно показывают свою работу.

Цитирование: Murat Duranay, F., Murat, E., Yıldırım, Ö. et al. MM-GradCAM: an improved multimodal GradCAM method with 1D and 2D ECG data for detection of cardiac arrhythmia. Sci Rep 16, 7919 (2026). https://doi.org/10.1038/s41598-026-38654-w

Ключевые слова: сердечная аритмия, электрокардиограмма, глубокое обучение, объяснимый ИИ, Grad-CAM