Clear Sky Science · fr

MM-GradCAM : une méthode GradCAM multimodale améliorée avec des données ECG 1D et 2D pour la détection des arythmies cardiaques

· Retour à l’index

Pourquoi cette étude sur le cœur vous concerne

Les battements cardiaques irréguliers, appelés arythmies, peuvent provoquer des pertes de connaissance, des AVC ou une mort subite, et pourtant ils n’annoncent souvent rien jusqu’à ce qu’il soit trop tard. Les médecins s’appuient sur l’électrocardiogramme (ECG) — ces lignes pointues familières retraçant l’activité cardiaque — pour repérer les anomalies. Ces dernières années, des programmes informatiques sont devenus très performants pour lire ces tracés, parfois au niveau des spécialistes. Mais ils fonctionnent généralement comme une boîte noire : ils donnent un résultat sans montrer comment ils y sont arrivés. Cette étude présente une nouvelle façon de rendre ces outils puissants plus transparents, en aidant les cliniciens à voir précisément quelles parties de l’ECG d’un patient ont guidé la décision de l’ordinateur.

Figure 1
Figure 1.

Regarder à l’intérieur de la boîte noire

Beaucoup de systèmes d’IA médicale modernes utilisent l’apprentissage profond, une technique qui découvre automatiquement des motifs dans les données au lieu de s’appuyer sur des règles manuelles. Si cela améliore souvent la précision, cela masque aussi le processus de raisonnement, ce qui pose un problème sérieux quand des vies sont en jeu. Pour instaurer la confiance, les chercheurs se sont tournés vers des méthodes d’« IA explicable » qui mettent en évidence les régions d’une image ou d’un signal ayant le plus influencé le jugement d’un modèle. L’un des outils les plus courants pour cela s’appelle Grad-CAM, qui produit des cartes thermiques — des surcouches colorées montrant où l’algorithme portait son attention. Jusqu’à présent, cependant, ces explications se limitaient généralement à un seul type d’entrée, comme le signal ECG brut ou une image, mais pas les deux ensemble.

Deux vues du même battement

Dans ce travail, les auteurs se sont concentrés sur un canal ECG couramment utilisé, appelé dérivation II, extrait d’une grande base de données publique de plus de 10 000 patients. Chaque enregistrement de 10 secondes a été traité de deux manières distinctes. D’abord, il a été conservé sous sa forme unidimensionnelle d’origine, une simple courbe traçant la tension au fil du temps. Ensuite, il a été transformé en image en niveaux de gris — essentiellement une bande ECG tracée et sauvegardée comme image. Pour chaque forme, l’équipe a construit un modèle d’apprentissage profond correspondant basé sur un réseau de neurones convolutionnel de 17 couches, une architecture répandue pour la reconnaissance de motifs. Un réseau a appris à partir du signal 1D, l’autre à partir de l’image 2D, et les deux ont été entraînés à classer les rythmes cardiaques en quatre groupes : rythme normal, rythme lent, un groupe de rythmes rapides, et les rythmes liés à la fibrillation atriale.

Combiner deux explications en une seule

Après l’entraînement, les chercheurs ont appliqué Grad-CAM séparément aux modèles basés sur le signal et sur l’image. Pour le modèle 1D, ils ont produit des segments colorés sur la ligne ECG indiquant les zones où le réseau se concentrait le plus. Pour le modèle image, ils ont généré des cartes thermiques mettant en évidence les points chauds dans l’image ECG. La nouvelle méthode, appelée MM-GradCAM (multi-modal Grad-CAM), a ensuite aligné ces deux vues dans le temps et l’espace et les a fusionnées en une seule explication. Cette carte unifiée montre, sur une bande ECG combinée, à la fois les indices temporels de la série et les motifs issus de l’image qui ont motivé la décision de l’IA. Un cardiologue a examiné de nombreux exemples, comparant les régions mises en évidence avec les caractéristiques connues des différents rythmes, comme l’absence d’ondes P dans la fibrillation atriale ou des battements très rapides et réguliers dans certains rythmes rapides.

Figure 2
Figure 2.

Quelle est la performance du système pour lire le battement

Sur des patients tests non vus lors de l’entraînement, le modèle basé sur l’image a correctement classé les rythmes dans environ 97 % des cas, tandis que le modèle basé sur le signal a atteint environ 93 % de précision. Les performances variaient selon le type de rythme, le modèle image faisant généralement mieux, notamment pour des motifs plus complexes ou subtils. En parallèle, les cartes fusionnées MM-GradCAM ont montré que chaque vue apporte quelque chose de différent. Chez certains patients atteints de fibrillation atriale, l’explication basée sur le signal a manqué des régions clés, alors que la carte image s’est correctement focalisée sur des segments où les formes d’ondes normales étaient absentes. Dans d’autres cas, comme certains rythmes rapides, la carte basée sur le signal a offert une image plus claire et cliniquement plus pertinente. En présentant les deux ensemble, MM-GradCAM a mis au jour des forces et des faiblesses qui seraient invisibles si un seul format d’entrée était utilisé.

Ce que cela signifie pour les soins cardiaques futurs

Le message principal de l’étude n’est pas seulement qu’un ordinateur peut détecter avec précision des rythmes cardiaques anormaux — de nombreux systèmes le font déjà — mais que son raisonnement peut désormais être rendu plus compréhensible pour les experts humains. En combinant les explications basées sur le signal et sur l’image en une vue cohérente, MM-GradCAM offre aux cardiologues un moyen de vérifier si l’IA « regarde » des parties médicalement significatives de l’ECG. Cela peut renforcer la confiance, aider à repérer des erreurs et même servir d’outil pédagogique pour les stagiaires qui apprennent à lire des rythmes complexes. Bien que la méthode doive encore être testée sur des groupes de patients plus divers et dans des flux de travail cliniques réels, elle ouvre la voie à un avenir où des outils d’IA puissants fournissent non seulement des réponses, mais montrent aussi clairement leur raisonnement.

Citation: Murat Duranay, F., Murat, E., Yıldırım, Ö. et al. MM-GradCAM: an improved multimodal GradCAM method with 1D and 2D ECG data for detection of cardiac arrhythmia. Sci Rep 16, 7919 (2026). https://doi.org/10.1038/s41598-026-38654-w

Mots-clés: arythmie cardiaque, électrocardiogramme, apprentissage profond, IA explicable, Grad-CAM