Clear Sky Science · sv

Identifiering av flera ögonsjukdomar med en hybrid quantum convolutional neural network med fundusbilder

2026-01-31 · Tillbaka till index

Skarpare ögonkontroller med smartare maskiner

Många av världens synproblem skulle kunna undvikas om ögonsjukdomar upptäcktes tidigt, men specialister och högkvalitativ avbildning finns inte alltid tillgängliga. I denna studie undersöks ett nytt sätt att tolka bilder av ögats bakre del, så kallade fundusbilder, genom att kombinera banbrytande kvantidéer med modern artificiell intelligens. Målet är enkelt men kraftfullt: att snabbt och pålitligt upptäcka flera vanliga ögonsjukdomar samtidigt, så att synräddande behandling kan påbörjas tidigare.

Varför ögats bakre del är viktig

Nätväven (retina) är ett tunt vävskikt längst bak i ögat som omvandlar ljus till signaler för hjärnan. Många allvarliga ögontillstånd lämnar karakteristiska spår här, inklusive åldersrelaterad makuladegeneration, glaukom, diabetisk retinopati, skador relaterade till hypertoni, myopi och grå starr. Läkare kan fotografera retinan med en standard funduskamera, som är billigare och mer utbredd än avancerade skannrar. Men att läsa dessa bilder manuellt är tidskrävande, kräver högt utbildade experter och blir särskilt svårt när tidiga sjukdomsförändringar är svaga eller när flera problem förekommer samtidigt.

Rensa upp bilden före diagnosen

Innan någon dator kan tolka fundusfoton måste bilderna rengöras och standardiseras. I detta arbete beskär författarna först den cirkulära ögonregionen, ändrar storlek och förbättrar sedan synligheten hos viktiga strukturer med två tekniker: anisotropisk diffusionsfiltrering för att minska brus utan att sudda ut viktiga kanter, och vågtransformer för att förbättra kontrasten. De utökar även träningsuppsättningen genom att rotera, zooma, skifta och spegelvända bilder samt genom att lägga till kontrollerat brus. Denna noggranna ”bildvård” hjälper modellen att lära sig hur verkliga bilder varierar och minskar risken att den misslyckas vid något annorlunda kameror eller belysningsförhållanden.

Blanda klassisk AI med kvantidéer

I studiens kärna finns ett hybrid quantum convolutional neural network, eller QCNN. Ett traditionellt convolutional neural network är mycket bra på att upptäcka mönster som linjer, texturer och former i bilder. QCNN behåller denna välbekanta struktur men lägger till kvantinspirerade lager som verkar på data kodade som kvanttillstånd. I praktiska termer komprimerar ett lättviktigt klassiskt nätverk först varje par bilder från en patients vänstra och högra öga. Dessa egenskaper mappas sedan in i en representation med åtta ”qubits”, där speciella kvantportar utför rotationer och skapar kopplingar mellan qubits. Detta gör att systemet kan utforska ett mycket rikt mönsterrum med relativt få justerbara parametrar.

Hur de kvantlagerna lär sig

Den kvantiska delen av modellen efterliknar välkända steg inom bildanalys. Kvantiska ”convolution”-lager fungerar som filter och söker efter användbara strukturer i data, medan kvantiska ”pooling”-lager minskar komplexiteten genom att slå samman information från flera qubits utan att förlora de viktigaste ledtrådarna. Systemet mäter upprepade gånger de resulterande kvanttillstånden och matar dessa mätningar till ett slutgiltigt beslutslager som ger sannolikheten för varje ögonsjukdomsetikett. Under träningen skjuter en klassisk optimerare både de vanliga neuronnätsvikterna och inställningarna för kvantportarna i rätt riktning för att förbättra prestandan, vägledd av standardmått som noggrannhet, precision, recall och F1‑score.

Testa modellen

För att avgöra om detta angreppssätt är mer än en elegant idé tränade och testade forskarna det på OIA‑ODIR, en stor offentlig samling med 10 000 fundusbilder från 5 000 patienter märkta för sju ögonsjukdomar plus normala ögon. Data delades så att vissa bilder användes för att träna modellen, några för finjustering och andra — både från samma plats och från externa platser — för att testa hur väl den generaliserar. Jämfört med flera starka djupinlärningssystem, inklusive Fundus‑DeepNet, Inception‑v4, VGG16 och ResNet‑101, placerade sig QCNN bäst. Den uppnådde runt 94 procent noggrannhet och liknande höga värden för precision, recall och F1‑score, både för interna och externa testuppsättningar, vilket betyder att den inte bara gjorde korrekta bedömningar ofta utan också fångade de flesta sjuka fall.

Vad detta betyder för patienter

Ur ett lekmannaperspektiv är budskapet att smartare mjukvara skulle kunna bidra till att skydda syn genom att göra storskalig retinal screening snabbare, mer konsekvent och kapabel att flagga flera sjukdomar samtidigt. Det kvantförstärkta nätverket som beskrivs här körs fortfarande på simulatorer och kräver kraftfulla datorer, så det är ännu inte redo för rutinmässig klinisk användning. Det är också behäftat med de vanliga begränsningarna för medicinsk AI, såsom ojämna data för sällsynta sjukdomar och skillnader mellan sjukhus. Ändå tyder dess starka prestanda på att en kombination av klassiska och kvantinspirerade metoder kan pressa mer information ur samma ögonfotografier. När kvantmaskinvara mognar och datamängder växer kan sådana system bli praktiska verktyg för att stödja ögonläkare världen över, särskilt där specialister är knappa.

Citering: Alqassab, A.I.M., Luque-Nieto, MÁ. & Mohammed, M.A. Identification of multiple ocular diseases using a hybrid quantum convolutional neural network with fundus images. Sci Rep 16, 6798 (2026). https://doi.org/10.1038/s41598-026-38063-z

Nyckelord: retinal fundusavbildning, detektion av ögonsjukdomar, kvantneuronätverk, analys av medicinska bilder, artificiell intelligens inom oftalmologi