Clear Sky Science · de
xGNN4MI: Erklärbarkeit von Graph Neural Networks in der 12-Kanal-Elektrokardiographie zur Klassifikation kardiovaskulärer Erkrankungen
Warum das für die Herzgesundheit wichtig ist
Herzinfarkte und andere Herzerkrankungen bleiben weltweit führende Todesursachen. Der Standardtest zur Erkennung von Herzproblemen ist das bekannte gezackte Linienbild des Elektrokardiogramms, kurz EKG. Ärztinnen und Ärzte greifen zunehmend auf künstliche Intelligenz zurück, um diese Signale zu interpretieren, doch viele KI-Werkzeuge verhalten sich wie undurchsichtige Black Boxes und liefern ein Urteil, ohne ihre Entscheidungswege offen zu legen. Diese Studie stellt einen neuen Ansatz namens xGNN4MI vor, der die Leistungsfähigkeit moderner KI erhalten und zugleich ihre Schlussfolgerungen für Klinikerinnen und Kliniker sichtbar und überprüfbar machen will.
Von Herzschlägen zu verbundenen Signalen
Ein EKG entsteht nicht aus einer einzigen Perspektive: zwölf verschiedene Ableitungen, die am Brustkorb und an den Gliedmaßen angebracht sind, liefern leicht unterschiedliche Blickwinkel auf die elektrische Aktivität des Herzens. Jede Ableitung ist sensitiv für eine andere Region des Herzmuskels und seiner Blutversorgung. Die Autorinnen und Autoren wandeln diese Mehrkanal-Aufzeichnung in ein Netzwerk um, bei dem jeder Knoten eine Ableitung repräsentiert und Kanten festhalten, wie sich diese Signale über die Zeit zueinander verhalten. Indem sie das zehnsekündige EKG in kürzere Abschnitte unterteilen und dieselbe Ableitung über die Abschnitte hinweg verbinden, bauen sie eine Struktur auf, die sowohl die Lage der Elektroden am Körper als auch den Ablauf des Herzschlags Schlag für Schlag widerspiegelt. Dieses Netzwerk dient dann als Eingabe für ein Graph Neural Network, eine KI-Architektur, die dafür konzipiert ist, auf Netzen miteinander verbundener Daten zu arbeiten statt auf einfachen Gittern oder Listen. 
Eine neue Pipeline zum Erkennen und Lokalisierten von Herzinfarkten
Auf Basis dieser Netzwerk-Sicht aufs EKG entwarf das Team eine Open-Source-Pipeline namens xGNN4MI. Sie deckt den gesamten Weg von Rohsignal bis zur Diagnose ab: den Aufbau des EKG-Graphen, das Training des Graph Neural Networks und schließlich die Erklärung, wie das Modell seine Vorhersagen trifft. Das System wurde an zwei anspruchsvollen Aufgaben getestet. Zunächst sollte es EKGs in fünf grobe diagnostische Gruppen einordnen, etwa Normalbefund, Herzinfarkt oder Leitungsstörungen. In einer zweiten, feineren Aufgabe sollte es zusätzlich den Ort des Herzinfarkts bestimmen und zwischen Schaden an der Vorderwand (anteroseptal) und der Unterwand (inferior) des Herzmuskels unterscheiden. Das Modell wurde auf einer großen öffentlichen EKG-Sammlung trainiert und anschließend mit einer separaten, bevölkerungsbasierten Kohorte geprüft, um zu testen, wie gut es auf neue Patientinnen und Patienten generalisiert.
Wie gut das System abschneidet
Bei der groben Gruppierungsaufgabe erzielte das Modell eine Genauigkeit von etwa sieben von zehn EKGs und zeigte besonders starke Leistung beim Erkennen normaler Aufzeichnungen und klarer Herzinfarkte. Einige Kategorien, die in ihrem Erscheinungsbild variabler sind, wie beispielsweise Herzmuskelverdickung oder Leitungsstörungen, ließen sich schwerer sauber trennen — vermutlich weil sie mehrere unterschiedliche zugrundeliegende Probleme umfassen. In der detaillierteren Aufgabe zur Lokalisierung von Herzinfarkten verbesserte sich die Leistung: Das System unterschied die wichtigen Infarktuntertypen mit einem gewichteten F1-Score nahe 0,8 auf dem Hauptdatensatz und zeigte eine gute Generalisierbarkeit auf die externe Kohorte. Es erkannte klassisch inferior- und anteroseptale Muster besonders zuverlässig. Allerdings gelang ihm die Identifikation wirklich gesunder Herzen in der externen Studie weniger gut, ein Hinweis darauf, dass subtile Unterschiede zwischen Datensätzen — etwa etwas längere QRS-Dauern, ein Maß dafür, wie lange die Aktivierung eines Herzschlags dauert — selbst gut trainierte Modelle aus der Bahn werfen können. 
Zu sehen, worauf die KI „schaut“
Ein zentrales Versprechen von xGNN4MI ist, dass es nicht nur eine Antwort liefert, sondern auch zeigt, welche Teile des EKG-Graphen am wichtigsten waren. Die Autorinnen und Autoren nutzten eine Methode namens GNNExplainer, um die einflussreichsten Ableitungen und Verbindungen für jede Vorhersage hervorzuheben. Wenn das Modell ein EKG als anteroseptalen Herzinfarkt einordnete, waren die wichtigsten Knoten die Brustwandableitungen V1 bis V3, was mit dem Lehrbuchwissen übereinstimmt, dass diese Ableitungen die Vorderwand des Herzens abbilden. Bei inferioren Herzinfarkten konzentrierte sich das Modell auf die Ableitungen II, III und aVF, ebenfalls im Einklang mit traditionellen Kriterien. Interessanterweise trat eine Extremitätenableitung (aVR), die bei der routinemäßigen Befundung oft übersehen wird, in einigen inferioren Fällen als ungewöhnlich wichtig hervor — ein Echo neuerer klinischer Berichte, die Veränderungen in dieser Ableitung mit schwereren Komplikationen in Verbindung bringen. Normale EKGs zeigten dagegen eine gleichmäßigere Verteilung der Wichtigkeit über die Ableitungen, was der Abwesenheit einer einzelnen geschädigten Region entspricht.
Beschränkungen und künftige Richtungen
Obwohl die Erklärungen gut mit etabliertem kardiologischem Wissen übereinstimmten, machten sie auch aktuelle Grenzen deutlich. Die Erklärmethode neigt dazu, sich auf Cluster verbundener Ableitungen zu konzentrieren und erfasst nicht vollständig entfernte Beziehungen oder feine zeitliche Details, obwohl diese klinisch relevant sein können. Das Modell arbeitet außerdem mit einer einzelnen dominanten Label-Vergabe und bildet noch nicht die Mischung von Bedingungen ab, die bei realen Patientinnen und Patienten häufig vorkommt. Die Autorinnen und Autoren schlagen vor, dass zukünftige Arbeiten fortgeschrittenere Erklärwerkzeuge nutzen könnten, die Zeit besser berücksichtigen, Multi-Label-Diagnosen einbeziehen und die Graphstruktur an spezifische Herzerkrankungen anpassen. Nichtsdestotrotz stellt xGNN4MI durch den offenen Code, die Dokumentation jeder Designentscheidung und den Nachweis, dass das Modell auf klinisch sinnvolle Regionen des EKG fokussiert, einen konkreten Schritt in Richtung KI-Werkzeuge dar, denen Ärztinnen und Ärzte vertrauen und die sie nutzen können.
Was das für Patientinnen, Patienten und Kliniker bedeutet
Einfach gesagt zeigt diese Arbeit, dass sich ein KI-Assistent zur EKG-Interpretation bauen lässt, der nicht nur Herzinfarkte erkennt und deren vermuteten Ort benennt, sondern auch auf dieselben Ableitungen hinweist, auf die sich menschliche Expertinnen und Experten stützen. Zwar ist das System noch nicht bereit, eine Kardiologin oder einen Kardiologen zu ersetzen, doch das Framework demonstriert, dass leistungsfähige graphbasierte KI transparenter gemacht und gegen medizinisches Wissen abgeglichen werden kann. Bei weiterer Verfeinerung und Validierung könnten solche Werkzeuge weniger erfahrene Clinician in vielbeschäftigten oder ressourcenarmen Umgebungen unterstützen, indem sie Hochrisiko-Herzinfarkte rasch markieren und gleichzeitig eine visuelle Spur liefern, wie die Entscheidung zustande kam.
Zitation: Maurer, M.C., Hempel, P., Steinhaus, K.E. et al. xGNN4MI: explainability of graph neural networks in 12-lead electrocardiography for cardiovascular disease classification. npj Digit. Med. 9, 256 (2026). https://doi.org/10.1038/s41746-026-02367-1
Schlüsselwörter: EKG KI, Graph Neural Networks, Myokardinfarkt, erklärbare künstliche Intelligenz, kardiovaskuläre Diagnose