Clear Sky Science · sv

RDE-DR: robusta djupensemble‑CNN för automatisk upptäckt av diabetisk retinopati från fundusbilder

2026-05-17 · Tillbaka till index

Varför ögonskanningar är viktiga för personer med diabetes

Diabetisk retinopati är en komplikation till diabetes som gradvis skadar den ljuskänsliga vävnaden längst bak i ögat. Upptäcks den i tid kan den ofta behandlas innan synen går förlorad. Men att manuellt granska tusentals retinala fotografier är tidskrävande för specialister. Denna studie undersöker hur en noggrant utformad blandning av artificiella intelligensmodeller kan hjälpa till att screena dessa bilder mer tillförlitligt, så att personer i riskzonen upptäcks snabbare och friska patienter undviker onödiga uppföljningar.

Figure 1. Hur kombinerade AI‑modeller screenar ögonfoton för att mer pålitligt markera diabetiska skador.

Söker efter varningssignaler i ögonfotografier

Forskarna fokuserar på färgfotografier av näthinnan, så kallade fundusbilder, från en publik samling kallad APTOS 2019‑datasetet. Dessa bilder visar små blodkärl och fläckar av blödning eller läckage som signalerar diabetisk skada. Teamet omvandlar de ursprungliga fem medicinska graderna till en enklare fråga som är relevant för storskalig screening: visar detta öga någon diabetisk retinopati eller inte. Det förvandlar uppgiften till ett ja‑ eller nej‑beslut som ett automatiserat system snabbt kan fatta för tusentals patienter.

Gör dolda detaljer lättare för datorer att se

Verkliga ögonfotografier varierar mycket i skärpa, ljusstyrka och färg, vilket kan förvirra datormodeller. För att minska detta problem använder författarna en kontrastförstärkande teknik kallad CLAHE som ljusar upp lokala detaljer utan att överdriva brus. De ändrar storleken på alla bilder till en standardiserad liten kvadrat, normaliserar färgerna och använder slumpmässiga rotationer och speglingar under träning så att systemet inte överanpassar sig till en enda kameravinkel eller ljusförhållande. Datasetet delas så att fyra femtedelar av bilderna lär modellerna och en femtedel hålls tillbaka för att testa hur väl systemet generaliserar till nya fall.

Många ögon istället för ett

I stället för att förlita sig på en enda djupinlärningsmodell tränar studien fyra populära konvolutionella neurala nätverk som ursprungligen utvecklades på en stor samling vardagsfotografier. Dessa modeller, kända i fältet som VGG16, VGG19, ResNet50 och DenseNet121, fintränas för att känna igen friska och sjuka näthinnor. Var och en presterar redan mycket bra på egen hand och klassificerar ungefär 98 procent av testbilderna korrekt och missar endast ett fåtal sjuka ögon. Kärnidén i arbetet är att kombinera deras styrkor genom flera beslutssammanslagningsscheman, inklusive enkel omröstning, genomsnittlig konfidens och mer avancerade regler inspirerade av fuzzy‑logik.

Figure 2. Hur förbättrade ögonbilder passerar genom flera AI‑nätverk vars sammanslagna signaler avgör sjukdom eller friskhet.

Kombinera modellernas omdömen med omsorg

Teamet studerar systematiskt sju sätt att blanda de fyra modellernas utsignaler, alltid under samma träningsrecept. De finjusterar också tröskelvärdet där en sannolikhet omvandlas till ett ja‑ eller nej‑utlåtande, i stället för att anta en fast mittpunkt. Genom att skanna igenom många trösklar mäter de hur noggrannhet, sensitivitet och precision vägs mot varandra, vilket är avgörande för screeningsverktyg som måste undvika både missad sjukdom och alltför många falska larm. De går sedan bortom enkel noggrannhet och undersöker hur säkert modellerna separerar friska från sjuka bilder med hjälp av ROC‑kurvor och täthetsdiagram för sannolikheter.

Vad resultaten betyder för framtida ögonscreening

Överlag behåller ensemblemetoderna eller förbättrar svagt de redan starka enskilda modellresultaten och når runt 98,6 procent noggrannhet och en mycket hög poäng för klassseparation. Enkla scheman som majoritetsomröstning eller att ta medelvärdet av konfidensvärden är anmärkningsvärt stabila, medan en av de fuzzy‑metoderna visar sig vara mer känslig för designval och ger mindre balanserad prestanda. För en lekmannaläsare är huvudbudskapet att kombinera flera vältränade bildtolkare, efter noggrann rengöring av bilderna och finjustering av hur deras röster slås ihop, leder till en mer pålitlig automatiserad assistent. Ett sådant verktyg kommer inte att ersätta ögonläkare men kan hjälpa dem att snabbt sortera stora mängder retinala fotografier och fokusera värdefull kliniktid på de patienter vars ögon visar tidiga tecken på problem.

Citering: Aiche, I., Brik, Y., Attallah, B. et al. RDE-DR: robust deep ensemble CNNs for automated diabetic retinopathy detection from fundus images. Sci Rep 16, 15226 (2026). https://doi.org/10.1038/s41598-026-48669-y

Nyckelord: diabetisk retinopati, fundusavbildning, djupt lärande, ensemblemodeller, medicinsk screening