Clear Sky Science · it

RDE-DR: robusti ensemble profondi CNN per il rilevamento automatizzato della retinopatia diabetica da immagini del fundus

· Torna all'indice

Perché le scansioni oculari sono importanti per le persone con diabete

La retinopatia diabetica è una complicanza del diabete che danneggia gradualmente il tessuto fotosensibile sul retro dell'occhio. Se individuata precocemente, può spesso essere trattata prima che la vista venga compromessa. Tuttavia, controllare manualmente migliaia di fotografie retiniche è dispendioso in termini di tempo per gli specialisti. Questo studio esplora come una combinazione accuratamente progettata di modelli di intelligenza artificiale possa aiutare a esaminare queste immagini in modo più affidabile, così da segnalare prima le persone a rischio e permettere ai pazienti sani di evitare controlli non necessari.

Figure 1. Come i modelli di IA combinati esaminano le foto oculari per segnalare i danni diabetici in modo più affidabile.
Figure 1. Come i modelli di IA combinati esaminano le foto oculari per segnalare i danni diabetici in modo più affidabile.

Cercare segnali d'allarme nelle fotografie oculari

I ricercatori si concentrano su fotografie a colori della retina, note come immagini del fundus, tratte da una raccolta pubblica chiamata dataset APTOS 2019. Queste immagini mostrano sottilissimi vasi sanguigni e macchie di sanguinamento o perdite che indicano danni diabetici. Il team ricodifica i cinque livelli clinici originali in una domanda più semplice rilevante per lo screening su larga scala: questo occhio mostra retinopatia diabetica oppure no. Questo trasforma il compito in una decisione sì/no che un sistema automatizzato potrebbe prendere rapidamente per migliaia di pazienti.

Rendere i dettagli nascosti più visibili ai computer

Le fotografie oculari del mondo reale variano molto in nitidezza, luminosità e colore, elementi che possono confondere i modelli computazionali. Per ridurre questo problema, gli autori utilizzano una tecnica di aumento del contrasto chiamata CLAHE che illumina i dettagli locali senza esagerare il rumore. Ridimensionano tutte le immagini a un quadrato standard di piccole dimensioni, normalizzano i colori e applicano rotazioni e ribaltamenti casuali durante l'addestramento in modo che il sistema non si adatti troppo a un singolo angolo di ripresa o condizione di luce. Il dataset viene suddiviso in modo che quattro quinti delle immagini servano per insegnare ai modelli e un quinto venga tenuto da parte per testare quanto bene il sistema si generalizza a nuovi casi.

Molti occhi invece di uno

Piuttosto che fare affidamento su un unico modello di deep learning, lo studio allena quattro popolari reti convoluzionali originariamente sviluppate su un'ampia raccolta di foto di uso quotidiano. Questi modelli, noti nel campo come VGG16, VGG19, ResNet50 e DenseNet121, vengono riaddestrati per riconoscere retine sane e malate. Ognuno di essi già si comporta molto bene da solo, classificando correttamente circa il 98 percento delle immagini di test e mancando soltanto pochi occhi malati. L'idea chiave del lavoro è combinare i loro punti di forza attraverso diversi schemi di fusione delle decisioni, incluso il voto semplice, la media delle confidenze e regole più avanzate ispirate alla logica fuzzy.

Figure 2. Come immagini oculari migliorate attraversano più reti di IA i cui segnali aggregati decidono malattia o salute.
Figure 2. Come immagini oculari migliorate attraversano più reti di IA i cui segnali aggregati decidono malattia o salute.

Combinare le opinioni dei modelli con attenzione

Il team studia sistematicamente sette modi di fondere le uscite dei quattro modelli, sempre sotto la stessa ricetta di addestramento. Ottimizzano anche il punto di soglia in cui una probabilità viene trasformata in una previsione sì/no, anziché assumere un valore fisso a metà strada. Scorrendo molti threshold, misurano come accuratezza, sensibilità e precisione si bilanciano, aspetto cruciale per strumenti di screening che devono evitare sia malattie non rilevate sia falsi allarmi eccessivi. Esaminano poi oltre la semplice accuratezza, valutando con quanta fiducia i modelli separano immagini sane da quelle malate tramite curve ROC e grafici di densità di probabilità.

Cosa significano i risultati per il futuro dello screening oculare

Nel complesso, i metodi ensemble mantengono o migliorano leggermente i già robusti risultati dei singoli modelli, raggiungendo circa il 98,6 percento di accuratezza e un punteggio molto elevato nella separazione delle classi. Schemi semplici come il voto di maggioranza o la media delle confidenze si rivelano sorprendentemente stabili, mentre uno dei metodi fuzzy mostra maggiore sensibilità alle scelte progettuali e offre prestazioni meno bilanciate. Per il non esperto, il messaggio principale è che combinare diversi lettori di immagini ben addestrati, dopo avere pulito accuratamente le immagini e messo a punto il modo in cui i loro voti vengono aggregati, porta a un assistente automatizzato più affidabile. Un tale strumento non sostituirà gli oculisti ma potrebbe aiutarli a smistare rapidamente grandi quantità di fotografie retiniche, concentrando il tempo clinico prezioso sui pazienti i cui occhi mostrano segni precoci di problemi.

Citazione: Aiche, I., Brik, Y., Attallah, B. et al. RDE-DR: robust deep ensemble CNNs for automated diabetic retinopathy detection from fundus images. Sci Rep 16, 15226 (2026). https://doi.org/10.1038/s41598-026-48669-y

Parole chiave: retinopatia diabetica, imaging del fundus, deep learning, modelli ensemble, screening medico