Clear Sky Science · ru
Раскрытие генетических открытий и оценка риска сердечно-сосудистых заболеваний посредством предсказания ЭКГ по генотипу
Чтение сердца по нашим генам
Большинство людей никогда не проходят тест на сердечный ритм в молодом возрасте, но почти у каждого ныне есть их ДНК, хранящаяся в крупных научных проектах. В этом исследовании поставлен смелый вопрос: можно ли воспользоваться этими генетическими записями, чтобы предсказать, как выглядел бы электрокардиографический след человека — и на основе этого оценить его будущий риск сердечных заболеваний? Если да, то врачи однажды смогут предупреждать людей о сердечно-сосудистых проблемах за годы до появления симптомов, используя лишь образец крови или слюны.

Почему сигналы сердца важны
Сердечно-сосудистые заболевания — ведущая причина смерти во всем мире. Простой, безболезненный тест, называемый электрокардиограммой (ЭКГ), фиксирует электрическую активность сердца и может выявлять опасные нарушения ритма или повреждение сердечной мышцы. Многие тонкие особенности ЭКГ, такие как амплитуды и ширины волн, частично наследуются. Крупные исследования показывают, что 40–70% различий между ЭКГ разных людей можно отнести к генетике. К сожалению, в больших биобанках, таких как UK Biobank, только около одного из десяти участников имеет и данные ДНК, и записи ЭКГ. Это затрудняет выявление всех генетических факторов, лежащих в основе сердечных заболеваний, и использование информации ЭКГ для масштабного раннего прогнозирования риска.
Обучение нейросети представлять ЭКГ
Исследователи разработали модель глубокого обучения под названием CapECG, которая учится переводить генетические варианты человека в 169 подробных ЭКГ-показателей. Они обучали её на более чем 37 000 человек европейского происхождения, у которых в UK Biobank были и ДНК, и 12-канальная ЭКГ. Поскольку геном содержит миллионы тесно связанных маркеров, сначала они сгруппировали близлежащие варианты в блоки, которые обычно наследуются вместе, и использовали метод LD-PCA для сжатия каждого блока до нескольких ключевых компонент. Затем CapECG применяет механизм «внимания», чтобы взвесить, какие блоки важны в большей степени, и капсульную структуру нейросети для захвата сложных, многоуровневых взаимосвязей между генетическими изменениями и признаками ЭКГ.
Насколько хорошо модель читает генетический отпечаток сердца
На внутреннем тестовом наборе из 7422 человек предсказанные CapECG признаки ЭКГ соответствовали реальным измерениям со средней корреляцией примерно 0,62 для 102 признаков, которые явно наследуемы. Некоторые характеристики модель предсказывала особенно точно, с корреляциями выше 0,8. Одно из направлений исследования — пространственный угол QRS-T, трехмерная мера того, как совпадают в пространстве активация и восстановление электрической активности сердца. Этот угол связывают с опасными нарушениями ритма и внезапной сердечной смертью. CapECG предсказывала этот угол с корреляцией около 0,65, а статистические проверки показали, что предсказанные и наблюдаемые значения тесно согласуются, особенно для признаков с более сильным генетическим вкладом.

Выявление скрытых генетических подсказок и прогнозирование заболеваний
После обучения CapECG применили к почти 390 000 участникам UK Biobank, у которых были данные ДНК, но не было записей ЭКГ, фактически «импутировав» их ЭКГ только по генам. Затем команда провела масштабные исследования генетических ассоциаций для этих предсказанных ЭКГ-признаков. Для пространственного угла QRS-T они обнаружили 133 значимых генетических локуса, включая 33, которые совпали с крупным предыдущим исследованием более чем 118 000 человек — значительно большее совпадение, чем при использовании меньшего набора реальных ЭКГ. Подобные преимущества наблюдались и для интервала QT, важной меры, связанной с опасными аритмиями. Анализ на уровне генов выявил десятки генов, участвующих в электрической проводимости сердца и контроле ритма, а также указал на дополнительные кандидаты, ранее не связанные с функцией сердца.
От предсказанных трассировок к будущим сердечным проблемам
Затем исследователи создали ещё одну модель глубокого обучения, DeepCVD, которая использует 169 предсказанных CapECG признаков, а также возраст и пол, чтобы оценить риск человека по шести основным сердечно-сосудистым состояниям, включая гипертонию, инфаркт и фибрилляцию предсердий. Обученная на сотнях тысяч генетически профилированных участников, DeepCVD достигла средней точности (AUC) примерно 0,80 в отложенной тестовой группе — существенно лучше стандартного полиgenicического риска, опиравшегося только на ДНК и базовые факторы, и показавшего около 0,71. Сопутствующая модель, DeepCVD-Age, использовала те же входные данные для прогнозирования возраста, в котором человек может получить диагноз; её предсказания сильно коррелировали (примерно 0,74) с реальным возрастом, указанным в базе, и показывали разумные результаты даже у людей неевропейского происхождения.
Что это может означать для пациентов
Проще говоря, эта работа демонстрирует, что система машинного обучения может выучить достаточно на основе объединённых данных ДНК и ЭКГ, чтобы «представить» ЭКГ для людей, у которых тест никогда не проводился. Эти воображаемые ЭКГ-признаки достаточны не только для обнаружения новых генов, вовлечённых в ритм и структуру сердца, но и для опережения широко используемых генетических шкал в прогнозировании того, кто разовьёт сердечное заболевание и примерно когда. Хотя подход требует проверки на независимых популяциях и дальнейшей доработки, он указывает на будущее, в котором простой генетический тест может дать окно в пожизненное состояние сердца человека задолго до появления первого аномального следа на экране клиники.
Цитирование: Lin, S., Yang, Y. & Zhao, H. Empowering genetic discoveries and cardiovascular risk assessment by predicting electrocardiograms from genotype. npj Digit. Med. 9, 255 (2026). https://doi.org/10.1038/s41746-026-02438-3
Ключевые слова: прогнозирование сердечно-сосудистого риска, генетика электрокардиограммы, глубокое обучение в медицине, исследования ассоциаций во всем геноме, данные биобанков