Clear Sky Science · fr

Un jeu de données multimodal de la rétine pour la détection de la rétinopathie diabétique à l’aide de modèles foundation

· Retour à l’index

Pourquoi il est crucial de détecter précocement les lésions oculaires

Pour les personnes atteintes de diabète, les lésions du tissu sensible à la lumière au fond de l’œil peuvent évoluer silencieusement pendant des années avant que la vision ne commence à se détériorer. Au moment où les symptômes apparaissent, certaines atteintes peuvent être irréversibles. Les médecins savent que des examens oculaires réguliers permettent de repérer les problèmes tôt, mais l’analyse manuelle de milliers d’images est lente et coûteuse. Cette étude présente une grande collection d’images rétiniennes soigneusement annotées, conçue pour aider les systèmes d’intelligence artificielle (IA) à apprendre à détecter la maladie oculaire diabétique avec plus de précision et de fiabilité, offrant ainsi une alerte plus précoce à beaucoup plus de patients.

Figure 1
Figure 1.

Différents points de vue caméra sur le même problème oculaire

Les ophtalmologistes utilisent plusieurs types d’appareils pour rechercher les lésions liées au diabète. Les photographies couleur standard du fond d’œil montrent une vue ronde et rougeâtre où peuvent apparaître de petites taches de sang, des dépôts lipidiques et de nouveaux vaisseaux fragiles. Les images ultra‑grand‑champ couvrent une zone beaucoup plus étendue, y compris les bords éloignés de la rétine où des lésions précoces peuvent se cacher. Un troisième outil, la tomographie par cohérence optique (OCT), coupe la rétine en coupe transversale, révélant des gonflements et des poches de liquide associés à un œdème maculaire menaçant la vision. Chaque méthode révèle des aspects différents du même processus pathologique et, ensemble, elles offrent un tableau plus complet de la santé oculaire.

Qu’est‑ce qui est nouveau dans cette collection d’images

Les jeux de données publics existants ont alimenté de nombreux systèmes d’IA pour le dépistage oculaire du diabète, mais la plupart se concentrent sur une seule modalité d’imagerie et ne fournissent que des étiquettes grossières, comme un seul grade global de la maladie. Certains contiennent des annotations bruitées ou omettent des types de lésions importants, et beaucoup manquent d’une bonne couverture des images grand‑champ ou d’informations détaillées sur le gonflement maculaire. Le nouveau jeu de données MMRDR vise à combler ces lacunes. Il rassemble 24 460 images sur trois modalités — photos couleur standard, images ultra‑grand‑champ et scans OCT — et y associe des annotations expertes riches. Pour les images couleur et grand‑champ, les médecins ont noté la gravité globale sur une échelle en cinq niveaux et ont enregistré sept types de lésions spécifiques, tels que de petites dilatations vasculaires, des hémorragies et des décollements de rétine. Pour les scans OCT, ils ont décrit si l’œdème maculaire est absent, présent en dehors du centre, ou affecte directement le centre de la vision.

Comment les images ont été sélectionnées et annotées

Les auteurs ont extrait les photographies couleur standard d’un jeu de données public issu d’un concours existant et ont obtenu les images grand‑champ et OCT d’un grand hôpital ophtalmologique chinois, en se concentrant sur des personnes diabétiques. Ils ont écarté les images de mauvaise qualité présentant flou, éclairage insuffisant ou zones centrales manquantes afin de garantir que les scans restants étaient cliniquement exploitables. Quatre ophtalmologistes expérimentés et un spécialiste rétinien senior ont développé des règles d’évaluation claires basées sur des directives internationales. Le spécialiste a d’abord constitué un ensemble de référence d’images, puis les autres évaluateurs se sont entraînés sur cet ensemble jusqu’à obtenir une forte concordance avec les décisions de l’expert. Ensuite, ils ont annoté indépendamment des milliers d’images, renvoyant les cas incertains au spécialiste. La collection finale équilibre un étiquetage approfondi et une forte cohérence entre médecins, en faisant un jeu d’apprentissage fiable pour l’IA.

Évaluer les IA d’aujourd’hui sur les données oculaires de demain

L’équipe a ensuite utilisé le jeu de données pour évaluer plusieurs types de modèles d’IA avancés. Ils ont testé des grands modèles vision‑langage initialement entraînés sur des images et textes généraux, des classifieurs d’images standard entraînés sur des photographies courantes, et des modèles « foundation » plus récents déjà affinés sur des images oculaires. Globalement, les modèles ont le plus de difficultés avec les images ultra‑grand‑champ, où le champ beaucoup plus large et des motifs plus complexes réduisent la précision par rapport aux photographies couleur standard. Les modèles spécifiquement conçus pour les images oculaires ont montré une meilleure capacité de transfert des vues standard vers le grand‑champ que les systèmes multimodaux généraux, suggérant que la connaissance de la structure rétinienne est réellement importante. Lorsque les chercheurs ont affiné un grand modèle multimodal sur MMRDR, ses performances se sont nettement améliorées, montrant que ce jeu de données peut apprendre même à des systèmes d’IA très flexibles à mieux gérer la maladie oculaire.

Figure 2
Figure 2.

Ce que cela signifie pour les soins oculaires futurs

Concrètement, ce travail fournit une bibliothèque d’enseignement de haute qualité pour les ordinateurs chargés d’identifier les lésions oculaires diabétiques. En combinant trois méthodes d’imagerie complémentaires et des annotations expertes détaillées, le jeu de données MMRDR permet aux chercheurs de construire et de comparer équitablement des outils d’IA qui évaluent la gravité de la maladie, localisent des lésions individuelles et suivent le gonflement maculaire. Bien que ces images à elles seules ne guérissent pas la cécité, elles constituent une base cruciale pour des systèmes de dépistage automatisés plus fiables qui pourraient détecter plus tôt les changements menaçant la vision et rendre des soins oculaires de niveau expert accessibles à beaucoup plus de personnes vivant avec le diabète.

Citation: Tang, Z., Wang, L., Guo, Z. et al. A multimodal retinal image dataset for diabetic retinopathy detection using foundation models. Sci Data 13, 639 (2026). https://doi.org/10.1038/s41597-026-07005-9

Mots-clés: rétinopathie diabétique, imagerie rétinienne, IA médicale, modèles foundation, OCT oculaire