Clear Sky Science · fr

Favoriser les découvertes génétiques et l’évaluation du risque cardiovasculaire en prédisant les électrocardiogrammes à partir du génotype

· Retour à l’index

Lire le cœur à partir de nos gènes

La plupart des personnes ne passeront jamais de test du rythme cardiaque tôt dans la vie, et pourtant presque tout le monde a aujourd’hui son ADN stocké dans de grands projets de recherche. Cette étude pose une question audacieuse : peut‑on utiliser ces archives génétiques pour prédire à quoi ressemblerait le tracé cardiaque d’une personne — et, à partir de là, estimer son risque futur de maladie cardiaque ? Si oui, les médecins pourraient un jour alerter des patients sur des problèmes cardiovasculaires des années avant l’apparition des symptômes, en s’appuyant uniquement sur un prélèvement sanguin ou salivaire.

Figure 1
Figure 1.

Pourquoi les signaux cardiaques importent

Les maladies cardiovasculaires sont la première cause de mortalité dans le monde. Un test simple et indolore, l’électrocardiogramme (ECG), enregistre l’activité électrique du cœur et peut révéler des troubles du rythme dangereux ou un muscle cardiaque endommagé. Beaucoup de caractéristiques subtiles d’un ECG, comme les hauteurs et largeurs de ses ondes, sont en partie héritées. De grandes études suggèrent que 40–70 % des différences entre les ECG des individus peuvent être attribuées à la génétique. Malheureusement, dans de grandes biobanques comme l’UK Biobank, seulement environ une personne sur dix possède à la fois des données ADN et des enregistrements ECG. Cela complique la découverte de l’ensemble des facteurs génétiques responsables des maladies cardiaques ou l’utilisation des informations ECG pour une prédiction précoce du risque à grande échelle.

Apprendre à un réseau neuronal à imaginer des ECG

Les chercheurs ont développé un modèle d’apprentissage profond nommé CapECG qui apprend à traduire les variantes génétiques d’une personne en 169 mesures ECG détaillées. Ils l’ont entraîné sur plus de 37 000 personnes d’ascendance européenne disposant à la fois de l’ADN et d’ECG 12‑dérivations dans l’UK Biobank. Comme le génome contient des millions de marqueurs étroitement liés, ils ont d’abord regroupé les variantes voisines en blocs qui ont tendance à être hérités ensemble et utilisé une méthode nommée LD‑PCA pour compresser chaque bloc en quelques composantes clés. CapECG applique ensuite un mécanisme d’« attention » pour pondérer quels blocs sont les plus importants, et un réseau neuronal de type capsule pour capturer des motifs complexes et stratifiés entre les changements génétiques et les traits ECG.

Quelle est la qualité de la lecture du « tatouage cardiaque » génétique

Sur un jeu de test interne de 7 422 personnes, les traits ECG prédits par CapECG correspondaient aux mesures réelles avec une corrélation moyenne d’environ 0,62 pour les 102 traits clairement héritables. Certaines caractéristiques ont été particulièrement bien prédites, avec des corrélations supérieures à 0,8. L’une des cibles de l’étude était l’angle spatial QRS‑T, une mesure tridimensionnelle de l’alignement entre l’activation et la récupération électriques du cœur dans l’espace. Cet angle a été associé à des troubles de rythme dangereux et à des morts cardiaques subites. CapECG a prédit cet angle avec une corrélation d’environ 0,65, et des contrôles statistiques ont montré que les valeurs prédites et observées étaient en bon accord, en particulier pour les traits sous plus forte influence génétique.

Figure 2
Figure 2.

Mettre au jour des indices génétiques cachés et prévoir la maladie

Une fois entraîné, CapECG a été appliqué à près de 390 000 participants de l’UK Biobank qui disposaient de l’ADN mais pas d’enregistrements ECG, « imputant » ainsi leurs ECG à partir de leurs gènes seuls. L’équipe a ensuite réalisé des études d’association génétique à grande échelle sur ces traits ECG prédits. Pour l’angle spatial QRS‑T, ils ont découvert 133 loci génétiques significatifs, dont 33 se recoupaient avec une grande étude précédente de plus de 118 000 personnes — beaucoup plus de recoupements que l’on n’obtient en utilisant uniquement le petit ensemble d’ECG réels. Des gains similaires ont été observés pour l’intervalle QT, une mesure clé liée aux arythmies dangereuses. Une analyse au niveau des gènes a mis en évidence des dizaines de gènes impliqués dans la signalisation électrique cardiaque et le contrôle du rythme, et a pointé des candidats supplémentaires auparavant non liés à la fonction cardiaque.

Des tracés prédits aux problèmes cardiaques futurs

Les chercheurs ont ensuite construit un autre modèle d’apprentissage profond, DeepCVD, qui utilise les 169 traits ECG prédits par CapECG, ainsi que l’âge et le sexe, pour estimer le risque d’une personne pour six principales affections cardiovasculaires, dont l’hypertension, l’infarctus et la fibrillation auriculaire. Entraîné sur des centaines de milliers de participants génétiquement profilés, DeepCVD a atteint une précision moyenne (AUC) d’environ 0,80 dans un groupe de test retenu — nettement supérieure à une approche standard de score polygénique qui s’appuyait uniquement sur l’ADN et des facteurs basiques et atteignait environ 0,71. Un modèle compagnon, DeepCVD‑Age, a utilisé les mêmes entrées pour prédire l’âge auquel une personne pourrait être diagnostiquée avec ces affections ; ses prédictions étaient fortement corrélées (environ 0,74) avec les âges réels consignés dans la base de données, et ont donné de bonnes performances même chez des personnes d’ascendance non européenne.

Ce que cela pourrait signifier pour les patients

En termes clairs, ce travail montre qu’un système d’apprentissage automatique peut apprendre suffisamment à partir de données ADN et ECG combinées pour « imaginer » un ECG pour des personnes n’ayant jamais passé le test. Ces traits ECG imaginés sont suffisamment fiables non seulement pour découvrir de nouveaux gènes impliqués dans le rythme et la structure cardiaques, mais aussi pour surpasser des scores génétiques largement utilisés dans la prédiction de qui développera une maladie cardiaque et à peu près quand. Bien que l’approche doive encore être testée dans des populations indépendantes et affinée, elle ouvre la voie à un avenir où un simple test génétique pourrait offrir une fenêtre sur la santé cardiaque d’une personne tout au long de sa vie, bien avant que le premier tracé anormal n’apparaisse sur un écran de clinique.

Citation: Lin, S., Yang, Y. & Zhao, H. Empowering genetic discoveries and cardiovascular risk assessment by predicting electrocardiograms from genotype. npj Digit. Med. 9, 255 (2026). https://doi.org/10.1038/s41746-026-02438-3

Mots-clés: prédiction du risque cardiovasculaire, génétique de l’électrocardiogramme, apprentissage profond en médecine, études d’association pangénomique, données de biobanques