Clear Sky Science · de
MEETI: Ein multimodales EKG‑Datenset aus MIMIC‑IV‑ECG mit Signalen, Bildern, Merkmalen und Interpretationen
Warum das für Herzgesundheit und die tägliche Versorgung wichtig ist
Jedes Jahr lassen Millionen von Menschen die elektrische Aktivität ihres Herzens als gezackte Linien aufzeichnen, sogenannte Elektrokardiogramme (EKGs). Diese Tests helfen Ärzten, gefährliche Rhythmusstörungen und andere Herzerkrankungen zu erkennen, doch das Lesen von EKGs ist zeitaufwändig und erfordert jahrelange Ausbildung. Gleichzeitig sind künstliche Intelligenz‑Systeme bei Aufgaben wie dem Auswerten von Röntgenbildern oder dem Zusammenfassen medizinischer Berichte deutlich besser geworden, während ähnliche Fortschritte bei EKGs langsamer vorangingen. Dieses Papier stellt MEETI vor, ein neues EKG‑Datenset, das mehrere Blickwinkel derselben Herzuntersuchung – Signale, Bilder, Messwerte und Erklärungen – zusammenführt, damit Computer lernen können, EKGs auf eine für Ärzte und Patienten verständliche Weise „zu verstehen“.

Eine neue, alles umfassende Sicht auf den Herzschlag
Traditionelle EKG‑Datenbanken bieten meist nur eine Informationsart: entweder das rohe elektrische Signal, ein EKG‑Bild, das wie Millimeterpapier aussieht, oder einen kurzen schriftlichen Befund. MEETI (Kurzform für MIMIC‑IV‑Ext ECG‑Text‑Image) ist die erste große öffentliche Ressource, die für jedes EKG vier Bestandteile sorgfältig zusammenführt: das originale 10‑Sekunden‑Signal aus 12 Ableitungen, ein hochauflösendes Bild, das dem Kassenblatt im Krankenhaus nachempfunden ist, eine Reihe präziser Schlag‑für‑Schlag‑Messungen und eine detaillierte schriftliche Interpretation, die von einem modernen Sprachmodell erzeugt wurde. All dies baut auf der umfangreichen MIMIC‑IV‑ECG‑Sammlung eines großen US‑Medizinzentrums auf und umfasst mehr als drei Viertel einer Million EKG‑Aufzeichnungen von über 160.000 Patienten. Durch die Verknüpfung dieser Teile über gemeinsame Identifikatoren verwandelt MEETI jedes EKG in ein reichhaltiges, mehrschichtiges Porträt der Herzaktivität.
Wie das Team Signale in reiche Daten verwandelt hat
Um MEETI zu erstellen, luden die Autorinnen und Autoren zunächst rund 800.000 EKG‑Datensätze herunter und prüften sie daraufhin, dass jeder Eintrag korrekt anonymisiert und technisch einwandfrei war. Mit Open‑Source‑Werkzeugen renderten sie jedes 12‑Ableitungs‑Signal in ein standardisiertes klinisches Layout in hoher Auflösung, wobei die feinen Details erhalten blieben, auf die Kardiologen angewiesen sind. Anschließend führten sie jedes EKG durch FeatureDB, ein Toolkit, das automatisch die bekannten P‑, QRS‑ und T‑Abschnitte jedes Herzschlags erkennt. Daraus berechnet das System Schlüsselgrößen wie Herzfrequenz, Abstände zwischen den Schlägen, Dauer verschiedener Teile des Herzzyklus und die Höhe oder Tiefe spezifischer Wellen. Diese Zahlen werden für jeden Schlag in jeder Ableitung gespeichert und liefern so eine ungewöhnlich detaillierte Sicht darauf, wie das Herz eines Menschen in diesen 10 Sekunden schlägt.
Sprachmodelle lehren, über Herzrhythmen zu sprechen
Kurz von Menschen verfasste EKG‑Befunde sind häufig vage und verstreichen oft die Chance, wie eine Diagnose mit messbaren Merkmalen im EKG zusammenhängt, klar darzulegen. Um diese Lücke zu schließen, entwarf das Team sorgfältige Prompt‑Vorlagen für ein hochmodernes Sprachmodell, damit es längere, klinisch fundierte Interpretationen generieren kann. Für jedes EKG erhält das Modell sowohl den originalen Befund der Klinik als auch die extrahierten Parameter – etwa Folgen von QRS‑Dauern über mehrere Schläge – und wird angewiesen, den Schlussfolgerungen der Expertinnen und Experten treu zu bleiben und die Messwerte als Belege zu nutzen. Kardiologinnen und Kardiologen halfen bei der Gestaltung und Überprüfung dieses Prozesses und bestätigten an Beispielen, dass die entstandenen Erklärungen dieselben Befunde wie die Originalbefunde wiedergeben und zugleich konkrete Zahlen einflechten. Das Ergebnis ist eine Textbeschreibung, die verbindet, was das Auge im Diagramm sieht, mit objektiven, reproduzierbaren Messwerten.
Was die Ressource enthält und wie sie genutzt werden kann
MEETI ist so organisiert, dass Forschende leicht von einem Patientenverzeichnis zu allen Studien und von jeder Studie zu dem zugehörigen Bild, den Signalen, den Schlag‑level‑Parametern und der Sprachmodell‑Erklärung navigieren können. Zusammenfassende Statistiken über den gesamten Datensatz zeigen, dass zentrale Messgrößen, wie die mittlere Schlagfolge oder die Länge des QRS‑Komplexes, in den erwarteten klinischen Bereichen liegen und nahezu keine fehlenden Werte aufweisen, was die Qualität und Vollständigkeit des Datensatzes unterstreicht. Die Autorinnen und Autoren stellen Beispielcode zum Laden der Daten sowie zum Lesen der Bilder und Texte bereit und veröffentlichen alle Skripte, die für die Parameterextraktion und Bildgenerierung verwendet wurden, als Open‑Source‑Werkzeuge. Diese Struktur erlaubt es Wissenschaftlerinnen und Wissenschaftlern, Modelle zu trainieren, die Wellenformen, Bilder und Sprache gemeinsam analysieren, und Fragen zu untersuchen, die von automatischer Rhythmusklassifikation bis hin zur Erzeugung verständlicher Berichte für Auszubildende und Patientinnen und Patienten reichen.

Was das für die künftige herzorientierte KI bedeutet
Die Autorinnen und Autoren kommen zu dem Schluss, dass MEETI einen zentralen Engpass beim Aufbau hilfreicher, vertrauenswürdiger KI‑Systeme für EKGs beseitigt. Indem rohe Signale, klinisch stilisierte Bilder, feingranulare Messwerte und ausführliche Erklärungen in einer einzigen, öffentlichen Ressource kombiniert werden, macht der Datensatz es möglich, Systeme zu trainieren, die mehr leisten als das schlichte Labeln einer Aufzeichnung als „normal“ oder „abnormal“. Zukünftige Modelle können etwa danach gefragt werden, wie bestimmte Veränderungen in der Wellenform eine Diagnose stützen, oder aufzeigen, welche Schläge und Ableitungen ihre Schlussfolgerungen getragen haben. Für Patientinnen und Patienten könnte dies langfristig klarere Befunde und eine frühere Erkennung subtiler Probleme bedeuten; für Klinikerinnen und Kliniker bietet es Werkzeuge, die nicht nur Expertenleistung erreichen, sondern sich auch erklären können. Kurz gesagt: MEETI legt das Fundament für die nächste Generation herzorientierter KI, die Herzschlag gleichzeitig sieht, misst und erklärt.
Zitation: Zhang, D., Lan, X., Geng, S. et al. MEETI: A Multimodal ECG Dataset from MIMIC-IV-ECG with Signals, Images, Features and Interpretations. Sci Data 13, 527 (2026). https://doi.org/10.1038/s41597-026-06796-1
Schlüsselwörter: Elektrokardiogramm‑Datensatz, multimodale medizinische KI, kardiovaskuläre Diagnostik, EKG‑Interpretation, medizinisches maschinelles Lernen