Clear Sky Science · fr

RDE-DR : réseaux de neurones convolutionnels profonds ensemblistes robustes pour la détection automatisée de la rétinopathie diabétique à partir d’images du fond d’œil

· Retour à l’index

Pourquoi les scans oculaires comptent pour les personnes diabétiques

La rétinopathie diabétique est une complication du diabète qui endommage progressivement le tissu sensible à la lumière à l’arrière de l’œil. Détectée tôt, elle peut souvent être traitée avant qu’une perte de vision ne survienne. Mais examiner manuellement des milliers de photographies rétiniennes prend beaucoup de temps pour les spécialistes. Cette étude explore comment un mélange soigneusement conçu de modèles d’intelligence artificielle peut aider à dépister ces images de façon plus fiable, afin que les personnes à risque soient signalées plus tôt et que les patients sains évitent des suivis inutiles.

Figure 1. Comment des modèles d’IA combinés dépistent plus fiablement les photos oculaires pour repérer les lésions diabétiques.
Figure 1. Comment des modèles d’IA combinés dépistent plus fiablement les photos oculaires pour repérer les lésions diabétiques.

Rechercher des signes d’alerte dans les photographies de l’œil

Les chercheurs se concentrent sur des photographies couleur de la rétine, appelées images du fond d’œil, issues d’une collection publique nommée jeu de données APTOS 2019. Ces images montrent d’infimes vaisseaux sanguins et des tâches d’hémorragie ou de fuite qui signalent des lésions diabétiques. L’équipe convertit les cinq grades médicaux originaux en une question plus simple, pertinente pour le dépistage à grande échelle : cet œil présente‑t‑il une rétinopathie diabétique ou non ? Cela transforme la tâche en une décision binaire que un système automatisé pourrait prendre rapidement pour des milliers de patients.

Rendre les détails cachés plus visibles pour les ordinateurs

Les photographies oculaires du monde réel varient beaucoup en netteté, luminosité et couleur, ce qui peut perturber les modèles informatiques. Pour réduire ce problème, les auteurs utilisent une technique d’amélioration du contraste appelée CLAHE qui éclaire les détails locaux sans exagérer le bruit. Ils redimensionnent toutes les images à un petit carré standard, normalisent les couleurs et appliquent des rotations et des retournements aléatoires pendant l’entraînement afin que le système ne s’adapte pas excessivement à un angle d’appareil photo ou une condition d’éclairage unique. Le jeu de données est divisé de sorte que quatre cinquièmes des images servent à entraîner les modèles et un cinquième est réservé pour tester la capacité du système à généraliser à de nouveaux cas.

Plusieurs yeux plutôt qu’un seul

Plutôt que de dépendre d’un seul modèle d’apprentissage profond, l’étude entraîne quatre réseaux de neurones convolutionnels populaires initialement développés sur une large collection de photos ordinaires. Ces modèles, connus dans le domaine sous les noms VGG16, VGG19, ResNet50 et DenseNet121, sont réentraînés pour reconnaître des rétines saines et malades. Chacun d’eux fonctionne déjà très bien individuellement, classant correctement environ 98 % des images de test et ne manquant qu’une poignée d’yeux malades. L’idée clé du travail est de combiner leurs forces via plusieurs schémas de fusion de décision, incluant un vote simple, la moyenne des confiances et des règles plus avancées inspirées de la logique floue.

Figure 2. Comment des images oculaires améliorées traversent plusieurs réseaux d’IA dont les signaux fusionnés décident maladie ou santé.
Figure 2. Comment des images oculaires améliorées traversent plusieurs réseaux d’IA dont les signaux fusionnés décident maladie ou santé.

Combiner les avis des modèles avec précaution

L’équipe étudie systématiquement sept manières de fusionner les sorties des quatre modèles, toujours sous la même recette d’entraînement. Elle ajuste aussi finement le seuil où une probabilité devient une prédiction oui/non, plutôt que de supposer un point médian fixe. En balayant de nombreux seuils, ils mesurent comment précision, sensibilité et exactitude se compensent, ce qui est crucial pour des outils de dépistage qui doivent éviter à la fois de manquer des maladies et de générer trop de faux positifs. Ils vont ensuite au‑delà de la simple exactitude, examinant à quel point les modèles séparent avec confiance les images saines et malades à l’aide de courbes ROC et de graphiques de densité de probabilité.

Ce que les résultats signifient pour le dépistage oculaire futur

Globalement, les méthodes ensemblistes maintiennent ou améliorent légèrement les bons résultats des modèles individuels, atteignant environ 98,6 % de précision et un score très élevé pour la séparation des classes. Des schémas simples comme le vote majoritaire ou la moyenne des confiances se révèlent remarquablement stables, tandis qu’une des méthodes floues s’avère plus sensible aux choix de conception et offre des performances moins équilibrées. Pour un non‑spécialiste, le message principal est que combiner plusieurs lecteurs d’images bien entraînés, après un nettoyage soigné des images et l’optimisation de la façon dont leurs votes sont fusionnés, conduit à un assistant automatisé plus fiable. Un tel outil ne remplacera pas les ophtalmologues mais pourrait les aider à trier rapidement un grand nombre de photographies rétiniennes, en concentrant le temps précieux en clinique sur les patients dont les yeux montrent des signes précoces de problème.

Citation: Aiche, I., Brik, Y., Attallah, B. et al. RDE-DR: robust deep ensemble CNNs for automated diabetic retinopathy detection from fundus images. Sci Rep 16, 15226 (2026). https://doi.org/10.1038/s41598-026-48669-y

Mots-clés: rétinopathie diabétique, imagerie du fond d’œil, apprentissage profond, modèles ensemblistes, dépistage médical