Clear Sky Science · fr
Évaluation de la santé cardiaque à travers scénarios et appareils à l’aide d’un modèle fondation multimodal pré-entraîné sur des données de 1,7 million de personnes
Pourquoi les données de votre rythme cardiaque comptent
Des moniteurs hospitaliers aux montres connectées, une partie croissante de notre vie est suivie par de faibles signaux électriques et optiques émis par le cœur. Ces enregistrements peuvent détecter des troubles du rythme dangereux, estimer la tension artérielle sans brassard et même indiquer un risque cardiaque futur. Mais comme les appareils et les contextes sont très variés, les algorithmes actuels fonctionnent souvent bien seulement dans les situations étroites pour lesquelles ils ont été conçus. Cette étude présente un nouveau type de modèle « fondation » pour les signaux cardiaques qui vise à comprendre la santé cardiaque à travers de nombreux appareils, pays et cas d’usage simultanément.

Plusieurs manières d’écouter le cœur
Les médecins et les appareils peuvent écouter le cœur de plusieurs façons. Le test classique en milieu hospitalier est l’électrocardiogramme (ECG) à 12 dérivations, avec des électrodes placées sur le thorax et les membres pour enregistrer l’activité électrique du cœur sous différents angles. Les unités de soins intensifs utilisent souvent moins de dérivations ainsi qu’un capteur optique appelé photopléthysmogramme (PPG), qui éclaire la peau pour suivre le flux sanguin dans les vaisseaux. À domicile, les montres connectées et les patchs peuvent n’enregistrer qu’une seule dérivation d’ECG ou seulement du PPG. Chacune de ces configurations produit des signaux de formes, durées et nombres de canaux différents, ce qui complique la création d’un modèle unique valable partout. Les approches traditionnelles entraînent généralement des algorithmes séparés et sur-mesure pour chaque appareil et tâche, et elles peinent lorsqu’on les déplace vers de nouveaux environnements ou de nouvelles populations.
Un seul cerveau pour de nombreux signaux cardiaques
Les chercheurs ont conçu un modèle fondation pour la détection cardiaque, ou CSFM, pour servir de cerveau commun à tous ces signaux. Plutôt que d’apprendre à partir d’un jeu de données ordonné, le CSFM a été entraîné sur une collection massive et hétérogène : environ 1,7 million d’enregistrements cardiaques provenant de plusieurs hôpitaux et pays, comprenant à la fois des formes d’onde ECG et PPG ainsi que les comptes rendus textuels rédigés par des médecins ou des machines. Le modèle découpe les signaux en courts segments, transforme à la fois signaux et mots en « tokens » et les injecte dans un transformeur, un type d’architecture d’apprentissage profond qui a permis des progrès récents en compréhension du langage et des images. Lors de l’entraînement, de larges portions des tokens sont délibérément masquées, et le modèle apprend à reconstruire les parties manquantes. Cet entraînement « masqué » pousse le CSFM à capturer les motifs essentiels partagés entre différents appareils, dérivations et langues de description.
Du diagnostic à la tension artérielle et au-delà
Une fois entraîné, le CSFM peut être adapté à de nombreuses tâches concrètes avec des jeux de données annotés relativement petits. L’équipe l’a testé pour la classification des rythmes et des maladies cardiaques en utilisant des ECG standard à 12 dérivations, des ECG portables mono‑dérivation et du PPG de montres connectées. Il a non seulement égalé mais souvent surpassé de solides réseaux profonds spécifiques à la tâche. Le CSFM a aussi aidé à estimer l’âge, le sexe et l’indice de masse corporelle directement à partir de courts segments d’ECG et de PPG, montrant qu’il avait intégré des indices subtils sur la personne et pas seulement sur le rythme cardiaque. Dans un autre ensemble d’expériences, le modèle a converti ECG et PPG en formes d’onde de pression artérielle continues puis en valeurs systoliques et diastoliques, produisant des estimations sans brassard de la pression artérielle plus précises que les méthodes concurrentes.

Fonctionner à travers les appareils et combler les lacunes
Un test particulièrement important était de savoir si le CSFM pouvait gérer des situations où seule une partie des informations habituelles est disponible. Les chercheurs ont montré que des modèles affinés à partir du CSFM fonctionnaient bien qu’ils reçoivent les 12 dérivations, six dérivations, deux dérivations courantes ou même une seule dérivation. Ils ont aussi testé des combinaisons d’entrées ECG uniquement, PPG uniquement et ECG-plus-PPG. Dans ces configurations, les systèmes basés sur CSFM sont restés performants tandis que les modèles conventionnels se dégradaient plus nettement. Les représentations internes du modèle pouvaient même être utilisées comme caractéristiques prêtes à l’emploi pour des outils simples comme les arbres à gradient boosté, atteignant souvent des performances proches de celles de réseaux profonds entièrement affinés. Enfin, en ajoutant une tête de régression, le CSFM pouvait générer un type de signal à partir d’un autre — par exemple produire un ECG réaliste à partir d’une trace PPG, ou reconstruire un ECG complet à 12 dérivations à partir d’une seule dérivation — ouvrant la voie à l’augmentation de données et à une meilleure analyse lorsque des enregistrements idéaux ne sont pas disponibles.
Ce que cela pourrait signifier pour les patients
Pour les non‑experts, le message principal est qu’un modèle unique et polyvalent peut désormais interpréter des enregistrements cardiaques très divers et fournir des réponses précises et cliniquement utiles. Plutôt que de développer un algorithme fragile par appareil et par hôpital, le CSFM offre une fondation partagée qui peut être légèrement adaptée aux besoins locaux, depuis la détection de rythmes dangereux sur une montre connectée jusqu’à la prédiction des patients à plus haut risque de décès dans l’année. Les auteurs reconnaissent des points ouverts, comme la nécessité de rendre les décisions du modèle plus compréhensibles pour les cliniciens et de réduire ses besoins en calcul. Néanmoins, leurs résultats suggèrent que des modèles fondation pour les signaux cardiaques pourraient aider à étendre la surveillance cardiaque avancée et la prédiction des risques à davantage de personnes, dans plus d’endroits, en utilisant les appareils qu’elles possèdent déjà.
Citation: Gu, X., Tang, W., Han, J. et al. Cardiac health assessment across scenarios and devices using a multimodal foundation model pretrained on data from 1.7 million individuals. Nat Mach Intell 8, 220–233 (2026). https://doi.org/10.1038/s42256-026-01180-5
Mots-clés: modèle fondation cardiaque, électrocardiogramme, photopléthysmographie, cardiologie numérique, surveillance cardiaque portable