Clear Sky Science · de
Kardiologische Gesundheitsbewertung über Szenarien und Geräte hinweg mithilfe eines multimodalen Foundation-Modells, vortrainiert an Daten von 1,7 Millionen Personen
Warum Ihre Herzschlagdaten wichtig sind
Von Krankenhaus‑Herzmonitoren bis zu Smartwatches werden immer mehr Aspekte unseres Lebens über winzige elektrische und optische Herzsignale erfasst. Diese Aufzeichnungen können gefährliche Rhythmusstörungen entdecken, den Blutdruck ohne Manschette schätzen und sogar Hinweise auf zukünftige Herzrisiken geben. Da Geräte und Anwendungsumgebungen jedoch sehr unterschiedlich sind, funktionieren heutige Algorithmen oft nur in den engen Situationen, für die sie entwickelt wurden. Diese Studie stellt eine neue Art von „Foundation“-Modell für Herzsignale vor, das darauf abzielt, kardiologische Gesundheit über viele Geräte, Länder und Anwendungsfälle hinweg zu erfassen.

Viele Möglichkeiten, dem Herzen zuzuhören
Ärztinnen und Geräte können das Herz auf verschiedene Weisen „hören“. Der klassische Krankenhaus‑Test ist das 12‑Kanäle‑Elektrokardiogramm (EKG), bei dem Elektroden über Brust und Gliedmaßen verteilt werden, um die elektrische Aktivität des Herzens aus verschiedenen Blickwinkeln zu messen. Auf Intensivstationen kommen oft weniger Ableitungen plus ein optischer Sensor namens Photoplethysmogramm (PPG) zum Einsatz, der Licht in die Haut sendet, um den pulsatilen Blutfluss in den Gefäßen zu verfolgen. Zu Hause zeichnen Smartwatches und Pflaster möglicherweise nur einen einzelnen EKG‑Kanal oder nur PPG auf. Jede dieser Konfigurationen erzeugt Signale mit unterschiedlichen Formen, Längen und Kanalanzahlen, was den Bau eines universellen Modells erschwert. Traditionelle Ansätze trainieren in der Regel separate, maßgeschneiderte Algorithmen für jedes Gerät und jede Aufgabe und haben Schwierigkeiten, wenn sie in neue Umgebungen oder Populationen übertragen werden.
Ein gemeinsames „Gehirn“ für viele Herzsignale
Die Forschenden entwickelten ein kardiologisches Sensing‑Foundation‑Modell (CSFM), das als gemeinsames „Gehirn“ für all diese Signale dienen soll. Anstatt von einem sauberen Datensatz zu lernen, wurde CSFM an einer großen und heterogenen Sammlung trainiert: etwa 1,7 Millionen Herzaufzeichnungen aus mehreren Krankenhäusern und Ländern, darunter sowohl EKG‑ als auch PPG‑Wellenformen sowie die textlichen Befunde, die Ärztinnen oder Maschinen dazu verfassten. Das Modell zerlegt Signale in kurze Segmente, verwandelt sowohl Signale als auch Worte in Token und führt diese einem Transformer zu — einer Deep‑Learning‑Architektur, die jüngste Fortschritte in Sprach‑ und Bildverarbeitung vorangetrieben hat. Während des Trainings werden große Teile der Token absichtlich verborgen, und das Modell lernt, die fehlenden Stücke zu rekonstruieren. Dieses „maskierte“ Training zwingt CSFM dazu, die wesentlichen Muster zu erfassen, die über verschiedene Geräte, Ableitungen und Beschreibungs‑Sprachen hinweg geteilt werden.
Von Diagnosen bis Blutdruck und darüber hinaus
Nach dem Training lässt sich CSFM mit vergleichsweise kleinen beschrifteten Datensätzen an viele konkrete Aufgaben anpassen. Das Team testete es bei der Klassifikation von Herzrhythmus und Erkrankungen anhand standardmäßiger 12‑Kanal‑EKGs, tragbarer Ein‑Kanal‑EKGs und PPGs von Smartwatches. Es erreichte nicht nur vergleichbare, sondern häufig bessere Resultate als starke, aufgabenspezifische tiefenlernende Netzwerke. CSFM half außerdem, Alter, Geschlecht und Body‑Mass‑Index direkt aus kurzen EKG‑ und PPG‑Segmenten abzuschätzen, was zeigt, dass es subtile Hinweise zur Person und nicht nur zum Herzschlag erfasst hatte. In einem weiteren Experiment setzte das Modell EKG‑ und PPG‑Daten in kontinuierliche Blutdruckwellenformen und daraus in systolische und diastolische Werte um und lieferte damit genauere manschettenlose Blutdruckschätzungen als konkurrierende Methoden.

Geräteübergreifend arbeiten und Lücken füllen
Ein besonders wichtiger Test war, ob CSFM Situationen bewältigen kann, in denen nur ein Teil der üblichen Informationen verfügbar ist. Die Forschenden zeigten, dass von CSFM feinabgestimmte Modelle gut funktionierten, egal ob sie alle 12 EKG‑Ableitungen, sechs Ableitungen, zwei gängige Ableitungen oder sogar nur eine einzelne Ableitung sahen. Sie testeten auch Kombinationen aus nur‑EKG, nur‑PPG und EKG‑plus‑PPG Eingaben. In diesen Konfigurationen blieben CSFM‑basierte Systeme robust, während konventionelle Modelle stärker an Leistung verloren. Die internen Repräsentationen des Modells ließen sich sogar als fertige Merkmale für einfache Werkzeuge wie gradientenverstärkte Bäume nutzen und erreichten oft eine Leistung, die mit vollständig feinabgestimmten tiefen Netzwerken vergleichbar war. Schließlich konnte CSFM durch Hinzufügen eines Regressionskopfs einen Signaltyp aus einem anderen erzeugen — zum Beispiel ein realistisches EKG aus einer PPG‑Kurve zu produzieren oder ein vollständiges 12‑Kanal‑EKG aus einer einzelnen Ableitung zu rekonstruieren — und öffnete damit Möglichkeiten für Datenaugmentation und verbesserte Analysen, wenn ideale Aufzeichnungen nicht verfügbar sind.
Was das für Patientinnen und Patienten bedeuten könnte
Für Nicht‑Expertinnen und Nicht‑Experten ist die Kernbotschaft, dass ein einzelnes, universell einsetzbares Modell jetzt sehr unterschiedliche Herzaufzeichnungen interpretieren und dennoch genaue, klinisch nützliche Antworten liefern kann. Anstatt für jedes Gerät und jedes Krankenhaus einen fragilen Algorithmus zu bauen, bietet CSFM eine gemeinsame Grundlage, die leicht an lokale Bedürfnisse angepasst werden kann — vom Erkennen gefährlicher Rhythmen an einer Smartwatch bis zur Vorhersage, welche Patientinnen und Patienten ein erhöhtes Sterberisiko innerhalb eines Jahres haben. Die Autorinnen und Autoren räumen offene Fragen ein, etwa wie sich die Entscheidungen des Modells für Klinikerinnen und Kliniker besser interpretierbar machen lassen und wie sich sein Rechenaufwand reduzieren lässt. Dennoch deuten ihre Ergebnisse darauf hin, dass Foundation‑Modelle für Herzsignale dazu beitragen könnten, fortgeschrittene kardiologische Überwachung und Risikovorhersage mehr Menschen an mehr Orten zugänglich zu machen — mit den Geräten, die sie bereits besitzen.
Zitation: Gu, X., Tang, W., Han, J. et al. Cardiac health assessment across scenarios and devices using a multimodal foundation model pretrained on data from 1.7 million individuals. Nat Mach Intell 8, 220–233 (2026). https://doi.org/10.1038/s42256-026-01180-5
Schlüsselwörter: kardiales Foundation-Modell, Elektrokardiogramm, Photoplethysmographie, digitale Kardiologie, tragbare Herzüberwachung