Clear Sky Science · pl
Klasyfikacja wieloklasowych chorób oczu za pomocą technik fuzji EfficientNetB0 w głębokim uczeniu
Dlaczego wczesne badania okulistyczne są ważne
Utrata wzroku często następuje powoli i dyskretnie. Powszechne problemy okulistyczne, takie jak zaćma, jaskra czy uszkodzenie siatkówki w przebiegu cukrzycy, mogą pozbawić widzenia na długo przed pojawieniem się wyraźnych objawów. Na całym świecie brakuje wystarczającej liczby specjalistów okulistycznych, którzy mogliby badać wszystkich na czas, zwłaszcza w obszarach wiejskich lub o niskich dochodach. W tym badaniu zbadano, jak inteligentny system komputerowy analizujący zdjęcia tylnej części oka mógłby pomóc lekarzom we wczesnym i wiarygodnym wychwyceniu kilku głównych chorób oczu, wykorzystując ten sam rodzaj sztucznej inteligencji, który napędza nowoczesne wyszukiwanie obrazów i rozpoznawanie twarzy.
Wykrywanie chorób na jednym zdjęciu
Okuliści już korzystają z kolorowych fotografii siatkówki — światłoczułej warstwy z tyłu oka — aby szukać zmian chorobowych. Na tych obrazach zaćma objawia się jako zmętnienie na drodze optycznej, jaskra zmienia kształt tarczy nerwu wzrokowego, a retinopatia cukrzycowa objawia się drobnymi wyciekami i bliznami na siatkówce. Badacze zgromadzili 4217 obrazów siatkówki o wysokiej rozdzielczości, starannie zbalansowanych w czterech grupach: oczy zdrowe, zaćma, jaskra i retinopatia cukrzycowa. Pracując na zrównoważonym zbiorze pochodzącym z kilku ogólnodostępnych źródeł, ograniczyli ryzyko, że komputer nauczy się skrótów związanych z jednym szpitalem, aparatem czy typem danych zamiast rzeczywistych oznak choroby. 
Puszczenie do pracy dwóch „mózgów”
Nowoczesne programy do analizy obrazów, zwane modelami głębokiego uczenia, bardzo dobrze wykrywają wzorce, ale każdy z nich ma własne mocne strony i ograniczenia. Zamiast polegać na pojedynczym modelu, zespół zbudował systemy „z podwójnym kręgosłupem”, które uruchamiają równolegle dwie znane sieci obrazowe, a następnie łączą ich spostrzeżenia. Jedna z tych sieci, EfficientNetB0, to zwarty, wydajny model, który wychwytuje ogólną strukturę obrazów; była ona zawsze używana jako baza. Sparowano ją kolejno z trzema innymi modelami — ResNet50, InceptionV3 i AlexNet — które specjalizują się odpowiednio w głębszym, wieloskalowym bądź lekkim rozpoznawaniu wzorców. Systemy następnie łączyły dwa zestawy cech na kilka sposobów: przez zwykłe złączenie, dodanie, różnicowanie wag lub przez pozwolenie każdemu modelowi na oddanie głosu przy ostatecznej decyzji.
Testowanie systemu
Badacze wytrenowali i dostroili 12 różnych kombinacji modeli na większości swoich obrazów siatkówki, odstawiając część do weryfikacji wydajności. W tym wewnętrznym teście najlepsze podejście polegało na połączeniu cech z EfficientNetB0 i ResNet50, osiągając około 95% ogólnej dokładności i niemal idealny wynik w standardowej miarze jakości diagnostycznej. Podobne kombinacje z InceptionV3 i AlexNet również radziły sobie dobrze. Aby sprawdzić, czy system poradzi sobie z rzeczywistą różnorodnością zamiast zapamiętywać tylko zbiór treningowy, zespół przetestował wszystkie modele na 400 obrazach z dwóch niezależnych kolekcji wykonanych w różnych szpitalach i różnymi aparatami. Tutaj dokładność wzrosła jeszcze bardziej, do około 95–98%, a wszystkie modele utrzymały bardzo wysokie wyniki w oddzielaniu oka chorego od zdrowego.
Zajrzeć do czarnej skrzynki
Lekarze i regulatorzy coraz częściej pytają nie tylko „Jak dokładny jest model?”, ale też „Dlaczego tak podejmuje decyzję?”. Aby to wyjaśnić, autorzy użyli narzędzi wizualizacyjnych, takich jak Score‑CAM i LIME. Narzędzia te podświetlają, które części obrazu najbardziej wpływają na werdykt modelu, zamieniając „uwagę” systemu w mapy cieplne nałożone na siatkówkę. W przypadku retinopatii cukrzycowej podświetlone obszary pokrywały się z przeciekającymi naczyniami krwionośnymi i plamami w pobliżu plamki, centrum ostrego widzenia. W jaskrze uwaga skupiała się na tarczy nerwu wzrokowego i otaczających tkankach, gdzie dochodzi do uszkodzeń. Decyzje związane z zaćmą podkreślały rozproszone zmętnienia na drodze wzrokowej. Co ważne, oczy prawidłowe nie wykazywały silnych, błędnie umiejscowionych punktów zainteresowania. To bliskie dopasowanie między obszarami, na które skupiał się model, a podręcznikową anatomią sugeruje, że system analizuje te same cechy, z których korzystają klinicyści w praktyce. 
Co to może oznaczać dla opieki codziennej
Dla niespecjalisty najważniejsze jest to, że pojedyncze zdjęcie siatkówki wykonane standardowym aparatem mogłoby wkrótce pomóc w przesiewowym wykrywaniu kilku głównych przyczyn ślepoty jednocześnie. Projekt z dwiema sieciami i inteligentne sposoby fuzji ich wyników zapewniły nie tylko wysoką dokładność, lecz także stabilność wyników, gdy obrazy pochodziły z nowych klinik i urządzeń — co jest konieczne w zastosowaniach praktycznych. Chociaż konieczne są dalsze testy na większych i bardziej zróżnicowanych populacjach, zwłaszcza zanim technologia będzie samodzielnie kierować leczeniem, praca ta pokazuje, że łączenie różnych typów sztucznych „oczu” może dawać szybkie i godne zaufania drugie opinie. W zatłoczonych szpitalach, małych przychodniach czy mobilnych jednostkach przesiewowych takie narzędzia mogłyby pomóc wyłonić osoby, które pilnie potrzebują wizyty u okulisty, potencjalnie ratując wzrok milionów.
Cytowanie: Sah, U.K., Chatterjee, J.M. & Sujatha, R. Multi-class eye disease classification using deep learning EfficientNetB0 fusion techniques. Sci Rep 16, 6368 (2026). https://doi.org/10.1038/s41598-026-35357-0
Słowa kluczowe: choroby oczu, obrazowanie siatkówki, głębokie uczenie, jaskra, retinopatia cukrzycowa