Clear Sky Science · fr
Apprentissage automatique explicable pour la prédiction du risque cardiovasculaire à long terme chez les adultes chinois d’âge moyen et âgés : étude de cohorte longitudinale sur 9 ans avec calculatrice de risque en ligne
Pourquoi la prédiction du risque cardiaque est importante
Les maladies cardiovasculaires sont désormais la première cause de mortalité en Chine, en particulier chez les personnes d’âge moyen et plus âgées. Pourtant, la plupart des outils que les médecins utilisent pour estimer le risque futur d’infarctus et d’AVC ont été développés sur des populations occidentales et ne conviennent pas bien aux adultes chinois. Cette étude s’est intéressée à la question de savoir si des méthodes modernes d’intelligence artificielle pouvaient fournir des estimations à long terme plus précises, tout en restant compréhensibles, et adaptées aux adultes chinois de 45 ans et plus.
Un regard national sur le vieillissement du cœur
Les chercheurs se sont appuyés sur l’étude longitudinale China Health and Retirement Longitudinal Study, une vaste enquête en cours qui suit des dizaines de milliers d’adultes vivant en communauté dans la plupart des provinces. À partir de cette ressource, ils ont sélectionné 8 080 personnes âgées d’au moins 45 ans qui n’avaient pas de maladie cardiovasculaire au début de l’étude en 2011. Ces participants ont ensuite été suivis pendant neuf ans pour recenser les nouveaux cas de maladies cardiaques et d’AVC. L’équipe a commencé avec 77 éléments d’information faciles à recueillir en consultation, notamment l’âge, la région, les antécédents médicaux, les symptômes d’humeur, les habitudes de sommeil, les mesures corporelles et les résultats d’analyses sanguines. Après des vérifications statistiques standard, ce nombre a été réduit à 11 facteurs clés à la fois pratiques à mesurer et fortement associés aux événements cardiovasculaires ultérieurs.

Apprendre aux ordinateurs à repérer les motifs
Ensuite, les investigateurs ont testé dix méthodes de prédiction informatiques différentes, allant de la régression logistique traditionnelle à des approches plus flexibles telles que les forêts aléatoires, le gradient boosting et les réseaux de neurones. Ils ont divisé les participants en un groupe d’entraînement, utilisé pour construire chaque modèle, et un groupe de validation distinct, utilisé pour tester la performance des modèles sur de nouvelles personnes. La performance a été jugée sur la capacité de chaque méthode à distinguer avec précision ceux qui ont développé une maladie cardiovasculaire de ceux qui sont restés indemnes, sur la concordance entre les risques prédits et les taux d’événements observés, et sur l’utilité des prédictions pour des décisions concrètes concernant qui devrait bénéficier d’efforts de prévention supplémentaires.
Quels facteurs quotidiens importaient le plus
La méthode des forêts aléatoires est arrivée en tête, obtenant une bonne précision et le meilleur équilibre entre la détection des individus à haut risque et la limitation des faux positifs. Pour rendre cette méthode plus transparente, l’équipe a utilisé une technique d’explication appelée SHAP, qui attribue à chaque facteur de risque une contribution à la prédiction finale. Cette analyse a montré que le tour de taille était le facteur le plus influent : chaque centimètre supplémentaire autour de la taille augmentait notablement le risque sur neuf ans, soulignant l’importance de la graisse abdominale dans cette population. Des taux élevés de triglycérides, un âge avancé et des antécédents d’hypertension artérielle figuraient également parmi les principaux facteurs de risque, tandis que des taux plus élevés de cholestérol HDL protecteur étaient associés à un risque moindre. Fait intéressant, l’humeur et les habitudes de sommeil apportaient une information indépendante : des scores de dépression plus élevés et une durée de sommeil nocturne trop courte ou trop longue faisaient tous deux augmenter le risque, même après prise en compte des facteurs médicaux traditionnels.

Du modèle de recherche à l’outil de tous les jours
Comme les 11 prédicteurs sont tous disponibles en soins primaires, l’équipe a traduit le modèle le plus performant en une calculatrice simple en ligne. L’utilisateur saisit l’âge, la région, certains antécédents médicaux sélectionnés, le tour de taille, deux mesures courantes des lipides sanguins, le score de dépression et la durée habituelle de sommeil. L’outil renvoie alors une estimation de la probabilité que cette personne développe une maladie cardiovasculaire au cours des neuf prochaines années. Les auteurs insistent sur le fait que cette calculatrice est conçue pour soutenir, et non remplacer, le jugement professionnel et doit être utilisée en complément d’une évaluation clinique complète, des ressources locales et des préférences du patient.
Ce que cela signifie pour les patients et les médecins
L’étude montre qu’un apprentissage automatique soigneusement conçu et expliqué peut fournir des estimations du risque cardiaque et d’AVC à long terme plus précises pour les adultes chinois d’âge moyen et âgés que les formules traditionnelles. Elle souligne également que le tour de taille, les lipides sanguins, ainsi que le sommeil et l’humeur quotidiens influent tous sur la santé cardiovasculaire future. En regroupant ces connaissances dans une calculatrice en ligne gratuite, ce travail offre aux cliniques de proximité et aux individus un moyen peu coûteux d’identifier plus tôt les personnes à risque élevé et d’orienter des stratégies de prévention adaptées, tout en laissant les décisions finales aux cliniciens.
Citation: Zhu, XY., Li, W., Pan, XY. et al. Explainable machine learning for long-term cardiovascular disease risk prediction in Chinese middle-aged and older adults: a 9-year longitudinal cohort study with web-based risk calculator. Sci Rep 16, 14998 (2026). https://doi.org/10.1038/s41598-026-45297-4
Mots-clés: maladie cardiovasculaire, apprentissage automatique, prévision du risque, tour de taille, adultes chinois