Clear Sky Science · sv

Multiklassklassificering av ögonsjukdomar med djupinlärning och EfficientNetB0‑fusionsmetoder

2026-02-13 · Tillbaka till index

Varför tidiga ögonkontroller är viktiga

Synförlust smyger sig ofta på i tysthet. Vanliga ögonproblem som grå starr, glaukom och diabetesrelaterade skador på näthinnan kan ta synen långt innan symtomen blir tydliga. Globalt finns det inte nog med ögonspecialister för att undersöka alla i tid, särskilt i landsbygds‑ eller låginkomstområden. Denna studie undersöker hur ett smart datorsystem som tolkar fotografier av ögats bakre del skulle kunna hjälpa läkare att tidigt och pålitligt upptäcka flera större ögonsjukdomar, med samma typ av artificiell intelligens som driver moderna bildsökningar och ansiktsigenkänning.

Att se sjukdom i ett enda ögonblick

Ögonläkare använder redan färgfoton av näthinnan — det ljuskänsliga lagret längst bak i ögat — för att leta efter sjukdom. I dessa bilder syns grå starr som grumling i optiska vägen, glaukom förändrar formen på synnerven och diabetisk retinopati präglar näthinnan med små läckor och ärr. Forskarna samlade 4 217 högupplösta retinalbilder, jämnt fördelade över fyra grupper: friska ögon, grå starr, glaukom och diabetisk retinopati. Genom att arbeta med en balanserad samling hämtad från flera publika källor minskade de risken att datorn lär sig genvägar kopplade till en viss klinik, kamera eller sjukdomstyp i stället för de verkliga tecknen på sjukdom.

Låt två hjärnor samarbeta

Moderna bildtolkningsprogram, så kallade djupinlärningsmodeller, är mycket bra på att upptäcka mönster men varje modell har sina styrkor och blinda fläckar. Istället för att förlita sig på en enda modell byggde teamet ”dubbel‑backbone”‑system som kör två välkända nätverk parallellt och sedan blandar deras observationer. Ett av dessa nätverk, EfficientNetB0, är en kompakt, effektiv modell som fångar bilders övergripande struktur; det användes alltid som bas. Det parade ihop sig i tur och ordning med tre andra modeller — ResNet50, InceptionV3 och AlexNet — som specialiserar sig på djupare, multiskaliga eller mer lättviktiga mönsterigenkänningar. Systemen kombinerade sedan de två uppsättningarna av egenskaper på flera sätt: genom att helt enkelt slå samman dem, addera dem, vikta dem olika eller låta varje modell rösta om slutgiltigt svar.

Sätta systemet på prov

Forskarna tränade och finjusterade 12 olika modellkombinationer på majoriteten av sina retinalbilder och reserverade några för att kontrollera prestanda. I detta interna test nådde det bästa tillvägagångssättet när de förenade funktioner från EfficientNetB0 och ResNet50, med cirka 95 % total noggrannhet och en nästan perfekt poäng på ett standardmått för diagnostisk kvalitet. Liknande kombinationer med InceptionV3 och AlexNet presterade också starkt. För att se om systemet kunde hantera verklig variation i stället för att bara memorera träningsuppsättningen testade teamet sedan alla modeller på 400 bilder från två oberoende samlingar tagna på olika sjukhus med olika kameror. Här steg noggrannheten ännu högre, till mellan ungefär 95 % och 98 %, och samtliga modeller bibehöll mycket höga poäng på hur väl de separerade sjuka och friska ögon.

Titta in i svart lådan

Läkare och tillsynsmyndigheter frågar i allt större utsträckning inte bara ”Hur noggrant är det?” utan också ”Varför avgör det så?”. För att svara på detta använde författarna visualiseringsverktyg som Score‑CAM och LIME. Dessa verktyg framhäver vilka delar av en bild som mest påverkar modellens dom och förvandlar systemets ”uppmärksamhet” till värmekartor överlagrade på näthinnan. För diabetisk retinopati överensstämde de framhävda områdena med läckande blodkärl och fläckar nära makula, synskärpecentret. Vid glaukom låg fokus på synnervshuvudet och omkringliggande vävnad där skada uppstår. Besluten kopplade till grå starr betonade diffus grumling längs synbanan. Avgörande nog visade inte normala ögon starka, felplacerade hotspots. Denna nära överensstämmelse mellan modellens fokus och lärobokens anatomi tyder på att systemet fokuserar på samma egenskaper som kliniker använder i praktiken.

Vad detta kan innebära för vardaglig vård

För en icke‑specialist är slutsatsen att ett enda retinalfoto, taget med en standardkamera, snart skulle kunna hjälpa till att screena för flera stora orsaker till blindhet samtidigt. Den dubbel‑nätverksdesignen och smarta sätt att fusera deras utgångar gav inte bara hög noggrannhet utan också stabila resultat när bilder kom från nya kliniker och enheter — ett måste för verklig användning. Även om mer testning på större och mer varierade populationer fortfarande behövs, särskilt innan tekniken kan styra behandling på egen hand, visar detta arbete att kombinationen av olika typer av artificiella ”ögon” kan ge snabba, pålitliga second opinions. I upptagna sjukhus, små kliniker eller mobila screeningsenheter kan sådana verktyg hjälpa till att flagga personer som mest akut behöver träffa en ögonläkare, vilket potentiellt kan bevara synen för miljontals människor.

Citering: Sah, U.K., Chatterjee, J.M. & Sujatha, R. Multi-class eye disease classification using deep learning EfficientNetB0 fusion techniques. Sci Rep 16, 6368 (2026). https://doi.org/10.1038/s41598-026-35357-0

Nyckelord: ögonsjukdom, retinal bilddiagnostik, djupinlärning, glaukom, diabetisk retinopati