Clear Sky Science · de
Genetische Entdeckungen und kardiovaskuläre Risikobewertung stärken: Vorhersage von Elektrodiagrammen aus dem Genotyp
Das Herz aus unseren Genen lesen
Die meisten Menschen erhalten früh im Leben nie einen Herzrhythmustest, doch nahezu jeder hat heutzutage seine DNA in großen Forschungsprojekten gespeichert. Diese Studie stellt eine kühne Frage: Können wir diese genetischen Aufzeichnungen nutzen, um vorherzusagen, wie das Herzkurvenbild einer Person aussehen würde — und daraus ihr zukünftiges Herzkrankheitsrisiko abzuschätzen? Wenn ja, könnten Ärztinnen und Ärzte eines Tages Menschen Jahre vor Auftreten von Symptomen vor kardiovaskulären Problemen warnen, allein mithilfe einer Blut- oder Speichelprobe.

Warum Herzsignale wichtig sind
Kardiovaskuläre Erkrankungen sind weltweit die häufigste Todesursache. Ein einfacher, schmerzloser Test, das Elektrokardiogramm (EKG), zeichnet die elektrische Aktivität des Herzens auf und kann gefährliche Rhythmusstörungen oder geschädigtes Herzmuskelgewebe aufzeigen. Viele feine Merkmale eines EKGs, wie die Höhen und Breiten seiner Wellen, sind teilweise vererbbar. Große Studien legen nahe, dass 40–70 % der Unterschiede zwischen EKGs von Personen auf genetische Faktoren zurückzuführen sind. Leider haben in großen Biobanken wie der UK Biobank nur etwa einer von zehn Teilnehmenden sowohl DNA-Daten als auch EKG-Aufzeichnungen. Das erschwert es, alle genetischen Faktoren hinter Herzerkrankungen aufzudecken oder EKG-Informationen in großem Maßstab für frühe Risikovorhersagen zu nutzen.
Ein neuronales Netz das EKGs vorstellt
Die Forschenden entwickelten ein Deep-Learning-Modell namens CapECG, das lernt, die genetischen Varianten einer Person in 169 detaillierte EKG-Messwerte zu übersetzen. Sie trainierten es an mehr als 37.000 Personen europäischer Abstammung, die sowohl DNA- als auch 12-Kanal-EKG-Daten in der UK Biobank hatten. Weil das Genom Millionen eng verwandter Marker enthält, gruppierten sie zunächst nahe beieinander liegende Varianten in Blöcke, die tendenziell gemeinsam vererbt werden, und verwendeten eine Methode namens LD-PCA, um jeden Block in wenige Schlüsselkomponenten zu komprimieren. CapECG wendet dann einen sogenannten "Attention"-Mechanismus an, um zu gewichten, welche Blöcke am wichtigsten sind, und ein kapselartiges neuronales Netzwerk, um komplexe, geschichtete Muster zwischen genetischen Veränderungen und EKG-Merkmalen zu erfassen.
Wie gut das Modell den genetischen Herzabdruck liest
In einem internen Testsatz von 7.422 Personen stimmten CapECGs vorhergesagte EKG-Merkmale mit den realen Messungen überein und zeigten für die 102 klar vererbbaren Merkmale eine durchschnittliche Korrelation von etwa 0,62. Einige Eigenschaften wurden besonders gut vorhergesagt, mit Korrelationen über 0,8. Ein Schwerpunkt der Studie war der räumliche QRS-T-Winkel, eine dreidimensionale Messung, wie die elektrische Aktivierung und Erholung des Herzens im Raum ausgerichtet sind. Dieser Winkel steht im Zusammenhang mit gefährlichen Rhythmusstörungen und plötzlichem Herztod. CapECG sagte diesen Winkel mit einer Korrelation von rund 0,65 vorher, und statistische Prüfungen zeigten, dass vorhergesagte und beobachtete Werte eng übereinstimmten, insbesondere bei Merkmalen mit stärkerem genetischem Einfluss.

Verborgene genetische Hinweise entdecken und Krankheiten vorhersagen
Nach dem Training wandten die Forschenden CapECG auf nahezu 390.000 UK-Biobank-Teilnehmende an, die DNA, aber keine EKG-Aufzeichnungen hatten, und "imputierten" so effektiv deren EKGs allein aus den Genen. Das Team führte dann groß angelegte genetische Assoziationsstudien auf diesen vorhergesagten EKG-Merkmalen durch. Für den räumlichen QRS-T-Winkel entdeckten sie 133 signifikante genetische Stellen, darunter 33, die mit einer größeren früheren Studie an mehr als 118.000 Personen übereinstimmten — deutlich mehr Überschneidung als bei der Verwendung der kleineren Menge an realen EKGs allein. Ähnliche Zugewinne zeigten sich beim QT-Intervall, einer wichtigen Messgröße, die mit gefährlichen Arrhythmien verknüpft ist. Genebene-Analysen hoben Dutzende von Genen hervor, die an der elektrischen Signalübertragung und Rhythmuskontrolle des Herzens beteiligt sind, und wiesen auf zusätzliche Kandidaten hin, die zuvor nicht mit Herzfunktion in Verbindung gebracht wurden.
Von vorhergesagten Kurven zu zukünftigen Herzproblemen
Die Forschenden bauten anschließend ein weiteres Deep-Learning-Modell, DeepCVD, das die 169 von CapECG vorhergesagten EKG-Merkmale plus Alter und Geschlecht nutzt, um das Risiko einer Person für sechs große kardiovaskuläre Erkrankungen abzuschätzen, darunter Bluthochdruck, Herzinfarkt und Vorhofflimmern. Trainiert an Hunderttausenden genetisch profilierten Teilnehmenden erreichte DeepCVD eine durchschnittliche Genauigkeit (AUC) von etwa 0,80 in einer zurückbehaltenen Testgruppe — deutlich besser als ein standardmäßiger polygenetischer Risikoscore-Ansatz, der nur auf DNA und Basisfaktoren beruhte und rund 0,71 erreichte. Ein Begleitmodell, DeepCVD-Age, verwendete dieselben Eingaben, um das Alter vorherzusagen, in dem jemand mit diesen Erkrankungen diagnostiziert werden könnte; seine Vorhersagen korrelierten stark (um 0,74) mit den tatsächlich in der Datenbank verzeichneten Altersangaben und lieferten auch bei Personen nicht-europäischer Abstammung noch vernünftige Resultate.
Was das für Patientinnen und Patienten bedeuten könnte
Einfach gesagt zeigt diese Arbeit, dass ein maschinelles Lernsystem aus kombinierten DNA- und EKG-Daten genug lernen kann, um für Personen, die nie einen Test hatten, ein EKG "vorzustellen". Diese vorgestellten EKG-Merkmale sind nicht nur ausreichend, um neue Gene zu entdecken, die an Herzrhythmus und -struktur beteiligt sind, sondern übertreffen auch weit verbreitete genetische Scores darin, vorherzusagen, wer an Herzkrankheiten erkranken wird und ungefähr wann. Während der Ansatz noch in unabhängigen Populationen getestet und weiter verfeinert werden muss, weist er auf eine Zukunft hin, in der ein einfacher Gentest ein Fenster in die lebenslange Herzgesundheit einer Person öffnen könnte — lange bevor die erste abnorme Kurve auf einem Klinikmonitor erscheint.
Zitation: Lin, S., Yang, Y. & Zhao, H. Empowering genetic discoveries and cardiovascular risk assessment by predicting electrocardiograms from genotype. npj Digit. Med. 9, 255 (2026). https://doi.org/10.1038/s41746-026-02438-3
Schlüsselwörter: Vorhersage kardiovaskuläres Risiko, Elektrokardiogramm Genetik, Deep Learning in der Medizin, genomweite Assoziationsstudien, Biobanken-Daten