Clear Sky Science · fr

Modèles d’apprentissage automatique pour prédire le risque de démence : preuves provenant de la Sydney Memory and Ageing Study

2026-04-27 · Retour à l’index

Pourquoi c’est important pour un vieillissement en bonne santé

La démence est l’une des affections les plus redoutées du grand âge, et pourtant beaucoup de personnes ne reçoivent un diagnostic que lorsque les problèmes de mémoire et de raisonnement sont déjà avancés. Cette étude pose une question porteuse d’espoir : en utilisant des informations que les cabinets collectent déjà — comme l’âge, des tests cognitifs simples, la glycémie et l’état cardiovasculaire — peut-on repérer qui a plus de chances de développer une démence jusqu’à dix ans à l’avance ? Si c’est le cas, les médecins pourraient concentrer la surveillance et les efforts préventifs sur les personnes qui en ont le plus besoin.

Un regard approfondi sur une étude longitudinale du vieillissement

Les chercheurs se sont appuyés sur la Sydney Memory and Ageing Study, qui a suivi plus d’un millier d’Australiens âgés de 70 ans et plus et exempts de démence au moment de l'inclusion. Sur une période d’environ dix ans, certains participants ont développé une démence, d’autres non. Au départ, chacun a passé des tests cognitifs et mnésiques détaillés, rempli des questionnaires sur l’humeur et subi des bilans médicaux incluant analyses sanguines et mesures de la santé cardiovasculaire. En identifiant les caractéristiques initiales les plus fréquentes chez ceux qui ont développé une démence, l’équipe a pu entraîner des modèles informatiques à reconnaître des profils à haut risque.

Apprendre aux machines à repérer le risque futur

Pour construire ces outils de prédiction, les auteurs ont comparé plusieurs méthodes courantes d’apprentissage automatique. Tous les modèles cherchaient à répondre à la même question : étant donné les informations basales d’une personne, quelle est la probabilité qu’elle ait une démence dix ans plus tard, en supposant qu’elle soit toujours en vie et évaluée ? Les algorithmes ont été entraînés sur les données d’environ 70 % des participants, puis testés sur les 30 % restants mis de côté comme contrôle inédit. Les entrées comprenaient l’âge, le niveau d’éducation, des symptômes d’humeur, des scores cognitifs détaillés, le rapport taille–hanche, un score standard de risque de maladie cardiaque et des mesures sanguines telles que cholestérol, triglycérides, acide urique, fonction rénale, marqueurs inflammatoires et glycémie à jeun. Un marqueur génétique de risque, l’APOE ε4, a été examiné ensuite comme option supplémentaire.

Quatre mesures simples portent l’essentiel du signal

Parmi les approches testées, une méthode épurée appelée régression LASSO a donné les meilleurs résultats. Malgré un grand nombre de candidats initiaux, ce modèle n’a conservé que quatre prédicteurs : l’âge, la performance cognitive globale, la glycémie à jeun et un score combiné du risque cardiovasculaire. Un âge plus élevé, une glycémie plus élevée et un profil cardiovasculaire plus défavorable augmentaient chacun le risque prédit, tandis que de meilleurs scores cognitifs le faisaient baisser. Dans le groupe de test mis à part, ce modèle à quatre facteurs pouvait classer correctement une personne qui développerait une démence au-dessus d’une personne qui n’en développerait pas environ trois fois sur quatre, un niveau considéré comme acceptable pour des outils de risque cliniques. Il offrait également un bon équilibre entre la détection des vrais cas futurs et l’évitement d’un trop grand nombre de faux positifs.

Ce qui n’a pas beaucoup apporté et comment utiliser l’outil

De façon surprenante, l’ajout du statut génétique APOE ε4 au modèle le plus performant n’a pas amélioré sa précision et a légèrement dégradé certaines mesures, une fois l’âge, la performance cognitive, la glycémie et le risque cardiovasculaire déjà inclus. Cela suggère que, du moins dans ce groupe de personnes âgées, l’histoire principale est portée par des informations cliniques de routine plutôt que par des tests génétiques ou des marqueurs sanguins expérimentaux. Les auteurs fournissent une formule simple implémentable dans un tableur pour transformer ces quatre valeurs en un risque estimé de démence à dix ans, qui peut ensuite être comparé à un seuil suggéré pour classer une personne en « risque élevé » ou « risque plus faible ». Ils expliquent aussi comment les systèmes de santé pourraient ajuster le point de départ du modèle si la démence est plus ou moins fréquente dans leurs propres populations ou dans différentes tranches d’âge.

Ce que cela signifie pour les patients et les cliniciens

Pour l’instant, ce travail constitue une preuve de concept plutôt qu’un programme de dépistage prêt à l’emploi. Il montre qu’un petit ensemble de mesures familières — l’âge, un test cognitif structuré, la glycémie à jeun et un score standard de risque cardiaque — peut classer de manière significative les personnes âgées en groupes de risque de démence plus bas ou plus élevé jusqu’à une décennie avant le diagnostic. Avant une utilisation à grande échelle, le modèle doit être testé dans d’autres pays, avec des tests cognitifs plus simples adaptés à la pratique quotidienne, et en parallèle avec des questions concrètes sur la façon dont patients et cliniciens réagissent à des estimations de risque probabilistes. Néanmoins, le message est encourageant : prêter attention à la santé cérébrale, à la glycémie et à la santé cardiaque ensemble pourrait aider à identifier ceux qui bénéficieraient le plus d’une surveillance renforcée et de stratégies préventives précoces.

Citation: Chalmers, R.A., Cervin, M., Choo, C. et al. Machine learning models for dementia risk prediction: evidence from the Sydney Memory and Ageing Study. npj Dement. 2, 27 (2026). https://doi.org/10.1038/s44400-026-00071-1

Mots-clés: prédiction du risque de démence, apprentissage automatique, vieillissement cognitif, santé cardiométabolique, détection précoce