Clear Sky Science · nl

Multi-class classificatie van oogziekten met deep learning EfficientNetB0-fusietechnieken

· Terug naar het overzicht

Waarom vroege oogcontroles belangrijk zijn

Gezichtsverlies sluipt vaak geruisloos binnen. Veelvoorkomende oogaandoeningen zoals staar, glaucoom en door diabetes veroorzaakte schade aan het netvlies kunnen het gezichtsvermogen wegnemen lang voordat symptomen duidelijk zijn. Wereldwijd zijn er niet genoeg oogspecialisten om iedereen op tijd te controleren, vooral in landelijke of laaginkomensgebieden. Deze studie onderzoekt hoe een slim computersysteem dat foto’s van de achterkant van het oog leest artsen zou kunnen helpen om meerdere belangrijke oogziekten vroegtijdig en betrouwbaar te herkennen, met hetzelfde soort kunstmatige intelligentie dat moderne beeldzoeken en gezichtsherkenning aandrijft.

Ziekte zien in één momentopname

Oogartsen gebruiken al kleurfoto’s van het netvlies — de lichtgevoelige laag achter in het oog — om naar ziekten te zoeken. Op deze beelden verschijnen staar als vertroebeling in het optische pad, verandert glaucoom de vorm van de oogzenuw en laat diabetische retinopathie het netvlies doorsneeën met kleine lekkages en littekens. De onderzoekers verzamelden 4.217 hoge‑resolutie retinale beelden, netjes verdeeld over vier groepen: gezonde ogen, staar, glaucoom en diabetische retinopathie. Door te werken met een gebalanceerde verzameling uit meerdere openbare bronnen verkleinden ze het risico dat de computer shortcuts leert die aan één ziekenhuis, camera of ziekttype zijn gebonden in plaats van aan de echte ziektekenmerken.

Figure 1
Figure 1.

Twee hersenen laten samenwerken

Moderne beeldleesprogramma’s, deep learning‑modellen genoemd, zijn erg goed in het herkennen van patronen, maar elk heeft zijn eigen sterke punten en blinde vlekken. In plaats van te vertrouwen op één model bouwde het team “dual‑backbone” systemen die twee bekende beeldnetwerken parallel laten draaien en vervolgens hun bevindingen mengen. Eén van die netwerken, EfficientNetB0, is een compact, efficiënt model dat de algemene structuur in beelden vastlegt; het werd altijd als basis gebruikt. Het werd telkens gecombineerd met drie andere modellen — ResNet50, InceptionV3 en AlexNet — die gespecialiseerd zijn in respectievelijk diepere, multiscale of lichtgewicht patroonherkenning. De systemen combineerden vervolgens de twee sets features op verschillende manieren: door ze simpelweg samen te voegen, op te tellen, verschillend te wegen of door elk model te laten stemmen over het eindantwoord.

Het systeem op de proef stellen

De onderzoekers trainden en stuurden 12 verschillende modelcombinaties af op het merendeel van hun retinale beelden, terwijl ze een deel apart hielden om de prestaties te toetsen. Bij deze interne test behaalde de beste aanpak door features van EfficientNetB0 en ResNet50 te koppelen ongeveer 95% totale nauwkeurigheid en een bijna perfecte score op een standaard maat voor diagnostische kwaliteit. Vergelijkbare combinaties met InceptionV3 en AlexNet presteerden ook sterk. Om te onderzoeken of het systeem echte variatie aankon in plaats van alleen het trainingsbestand te memoriseren, testte het team alle modellen vervolgens op 400 beelden uit twee onafhankelijke verzamelingen, genomen in verschillende ziekenhuizen met andere camera’s. Hier steeg de nauwkeurigheid zelfs nog, naar ongeveer 95% tot 98%, en alle modellen behielden zeer hoge scores in het scheiden van zieke en gezonde ogen.

In de zwarte doos kijken

Artsen en toezichthouders vragen steeds vaker niet alleen “Hoe nauwkeurig is het?” maar ook “Waarom besluit het op die manier?”. Om dit te beantwoorden gebruikten de auteurs visualisatietools zoals Score‑CAM en LIME. Deze tools markeren welke delen van een beeld het meest van invloed zijn op het oordeel van het model en zetten de ‘aandacht’ van het systeem om in hittekaarten die over het netvlies worden gelegd. Voor diabetische retinopathie kwamen de gemarkeerde gebieden overeen met lekkende bloedvaten en vlekjes in de buurt van de macula, het centrum voor scherp zicht. Bij glaucoom lag de focus op de oogzenuwkop en het omliggende weefsel, waar schade optreedt. Bij staargerelateerde beslissingen werd diffuse vertroebeling langs het visuele pad benadrukt. Belangrijk is dat normale ogen geen sterke, misplaatste hotspots lieten zien. Deze nauwe overeenkomst tussen de focus van het model en de leerboekanatomie suggereert dat het systeem zich richt op dezelfde kenmerken die clinici in de praktijk gebruiken.

Figure 2
Figure 2.

Wat dit kan betekenen voor de dagelijkse zorg

Voor een niet‑specialist is de kernboodschap dat één enkele retinale foto, genomen met een standaardcamera, binnenkort zou kunnen helpen bij het screenen op meerdere belangrijke oorzaken van blindheid tegelijk. Het duale netwerkontwerp en slimme manieren om hun outputs te fuseren leverden niet alleen hoge nauwkeurigheid maar ook stabiele resultaten wanneer beelden uit nieuwe klinieken en apparaten kwamen — een vereiste voor gebruik in de praktijk. Hoewel meer testen op grotere en meer diverse populaties nodig zijn, vooral voordat de technologie zelfstandig behandeling mag sturen, laat dit werk zien dat het combineren van verschillende typen kunstmatige “ogen” snelle, betrouwbare second opinions kan opleveren. In drukke ziekenhuizen, kleine spreekuren of mobiele screeningsunits zouden dergelijke hulpmiddelen kunnen helpen mensen te signaleren die het meest dringend een oogarts moeten zien, en daarmee mogelijk het gezichtsvermogen van miljoenen behouden.

Bronvermelding: Sah, U.K., Chatterjee, J.M. & Sujatha, R. Multi-class eye disease classification using deep learning EfficientNetB0 fusion techniques. Sci Rep 16, 6368 (2026). https://doi.org/10.1038/s41598-026-35357-0

Trefwoorden: oogziekte, retinale beeldvorming, deep learning, glaucoom, diabetische retinopathie