Clear Sky Science · fr

Détection de l'IMC à partir d'un test de dessin manuscrit utilisant un residual vision transformer

· Retour à l’index

Pourquoi de simples dessins peuvent révéler des problèmes de mémoire cachés

Imaginez qu’un médecin puisse repérer des signes avant‑coureurs de démence simplement en regardant la façon dont vous dessinez une horloge, un cube ou une ligne de cercles reliés. Ces croquis rapides sont déjà utilisés en clinique, mais ils sont notés manuellement et dépendent beaucoup du jugement du praticien. Cet article montre comment un système d’intelligence artificielle (IA) nommé ResViT peut « lire » ces dessins automatiquement, transformant les traits du stylo en une alerte précoce pour le déclin cognitif léger (DCL), un stade entre le vieillissement normal et la démence où le traitement et la planification peuvent encore faire une grande différence.

Des tests papier‑crayon au dépistage intelligent

Le déclin cognitif léger se manifeste souvent d’abord dans des tâches quotidiennes qui exigent planification, attention et sens de l’espace — précisément ce que cherchent à évaluer les tests de dessin. Les médecins demandent couramment aux patients de dessiner une horloge indiquant une heure précise, de reproduire un cube tridimensionnel ou de relier des nombres et lettres épars dans l’ordre. Autrefois, chaque dessin devait être évalué à l’œil nu, ce qui est lent et peut varier d’un clinicien à l’autre. Les auteurs ont voulu construire un système plus objectif qui analyse les trois dessins ensemble, en utilisant l’ordinateur pour repérer des motifs que même un œil entraîné pourrait manquer. Leur objectif n’est pas de remplacer les médecins, mais de leur fournir un second avis rapide et cohérent.

Figure 1
Figure 1.

Mêler deux façons de voir : les détails et la vue d’ensemble

Le cœur de l’étude est un modèle hybride d’IA appelé ResViT, conçu pour combiner deux styles complémentaires d’analyse d’image. Une partie, basée sur une technique connue sous le nom de ResNet, est particulièrement efficace pour repérer les détails fins comme les bords, les coins et les petites déformations des traits d’un dessin. L’autre partie, un Vision Transformer, excelle à comprendre la configuration globale — comment les éléments d’une horloge, d’un cube ou d’un tracé s’organisent sur la page. Plutôt que de faire passer les dessins successivement dans ces composants, le système les exécute en parallèle, puis fusionne les deux flux d’informations en une image unique et plus riche de l’état cognitif de la personne.

Comment le système apprend à partir de dessins de patients réels

Pour tester leur idée, les chercheurs ont utilisé une collection publique de dessins provenant de 918 personnes, chacune ayant réalisé les tâches d’horloge, de cube et de trail‑making. Le statut cognitif de chaque personne avait déjà été évalué à l’aide d’un test clinique standard, fournissant une étiquette de vérité de terrain indiquant « sain » ou « DCL ». L’équipe a converti les dessins en images niveaux de gris, les a redimensionnés et a appliqué des ajustements simples tels que rotations et variations de luminosité pour rendre le modèle plus robuste. Lors de l’entraînement, ResViT a comparé à plusieurs reprises ses prédictions aux étiquettes connues et a ajusté ses paramètres internes, avec des garde‑fous comme l’arrêt précoce et le dropout pour éviter de mémoriser les données d’entraînement au lieu d’apprendre des règles générales.

Performance et révélations

Testé sur des personnes qu’il n’avait jamais vues auparavant, ResViT a correctement distingué les individus sains de ceux atteints de DCL dans environ les trois quarts des cas, avec une précision de 74,09 % et un score F1 équilibré autour de 0,67. Cela a surpassé plusieurs alternatives solides, notamment des versions n’utilisant que la partie ResNet, uniquement le Vision Transformer, ou un autre réseau populaire appelé EfficientNet. L’approche hybride, comptant environ un tiers des paramètres internes d’un grand transformer autonome, s’est avérée particulièrement efficace pour équilibrer sensibilité à la maladie et limitation des faux positifs. À l’aide de visualisations par cartes de chaleur, les auteurs ont aussi montré que le modèle a tendance à se concentrer sur des régions cliniquement signifiantes — comme les chiffres d’une horloge, les arêtes d’un cube et les points de bifurcation dans les tracés — ce qui suggère qu’il prête attention aux mêmes indices que les experts humains.

Figure 2
Figure 2.

Limites actuelles et possibilités futures

Les auteurs insistent sur le fait que leur système n’est pas encore prêt à devenir un outil de dépistage universel. Le jeu de données est de taille modeste, biaisé vers les adultes plus âgés, et manque d’informations contextuelles importantes comme le niveau d’éducation et les différences culturelles, qui peuvent toutes influencer la façon de dessiner. Le modèle peut aussi être exigeant en calcul pour des appareils à faible puissance. Néanmoins, parce que ResViT peut être adapté avec relativement peu de nouveaux exemples, il pourrait être étendu à d’autres troubles cognitifs ou à de nouvelles tâches de dessin à mesure que davantage de données deviennent disponibles. Intégrer des jeux de données plus larges et diversifiés, et construire des versions plus légères du modèle, seront des étapes cruciales vers une utilisation quotidienne.

Ce que cela signifie pour les patients et les familles

En termes simples, ce travail montre qu’une IA soigneusement conçue peut transformer de simples croquis papier‑crayon en un outil pratique pour détecter tôt des problèmes de mémoire et de réflexion. Bien qu’un taux de précision de 74 % ne soit pas parfait, il est prometteur pour une première ligne de défense bon marché, rapide et facile à répéter dans le temps. À l’avenir, un dessin scanné en clinique, ou même sur une tablette à domicile, pourrait discrètement signaler des changements subtils bien avant qu’ils ne deviennent évidents dans la vie quotidienne, donnant aux médecins et aux familles plus de temps pour réagir. Plutôt que de remplacer le jugement humain, des systèmes comme ResViT pourraient rendre ce jugement plus cohérent et plus opportun, apportant une aide plus précoce aux personnes à risque de démence.

Citation: Sirshar, M., Matloob, I., Tayyabah, A. et al. MCI detection from handwritten drawing test using residual vision transformer. Sci Rep 16, 10334 (2026). https://doi.org/10.1038/s41598-026-40716-y

Mots-clés: déclin cognitif léger, tests de dessin, apprentissage profond, vision transformer, détection précoce de la démence