Clear Sky Science · pl

RDE-DR: odporne zespoły głębokich sieci CNN do zautomatyzowanego wykrywania retinopatii cukrzycowej na zdjęciach dna oka

2026-05-17 · Powrót do spisu

Dlaczego skany oka mają znaczenie dla osób z cukrzycą

Retinopatia cukrzycowa to powikłanie cukrzycy, które stopniowo uszkadza światłoczułą tkankę na tylnym odcinku oka. Wczesne wykrycie często pozwala na leczenie zanim dojdzie do utraty wzroku. Jednak ręczne analizowanie tysięcy fotografii siatkówki zajmuje specjalistom dużo czasu. W tym badaniu zbadano, jak starannie zaprojektowana mieszanka modeli sztucznej inteligencji może pomóc w bardziej niezawodnym przesiewaniu tych obrazów, tak aby osoby zagrożone zostały szybciej wyłapane, a zdrowi pacjenci uniknęli niepotrzebnych kontroli.

Figure 1. W jaki sposób połączone modele AI przesiewają zdjęcia oczu, by bardziej niezawodnie wykrywać zmiany cukrzycowe.

Szukając sygnałów ostrzegawczych na fotografiach oka

Naukowcy skupiają się na kolorowych fotografiach siatkówki, zwanych obrazami dna oka, pochodzących z publicznego zbioru APTOS 2019. Zdjęcia te ukazują drobne naczynia krwionośne oraz miejsca krwawień lub wycieków, które sygnalizują uszkodzenia cukrzycowe. Zespół przekształca oryginalne pięć stopni klasyfikacji medycznej w prostsze pytanie istotne dla przesiewów na dużą skalę: czy na tym oku występuje retinopatia cukrzycowa, czy nie. Dzięki temu zadanie staje się decyzją tak/nie, którą system automatyczny mógłby szybko podejmować dla tysięcy pacjentów.

Ułatwianie komputerom dostrzeżenia ukrytych szczegółów

Rzeczywiste zdjęcia oka różnią się ostrością, jasnością i barwą, co może wprowadzać w błąd modele komputerowe. Aby zredukować ten problem, autorzy stosują technikę zwiększania kontrastu zwaną CLAHE, która rozjaśnia lokalne szczegóły bez nadmiernego wzmacniania szumu. Zmieniono rozmiar wszystkich obrazów do standardowego małego kwadratu, znormalizowano kolory i użyto losowych obrotów oraz odbić w trakcie treningu, aby system nie dopasował się nadmiernie do jednego kąta kamery czy warunków oświetleniowych. Zbiór danych podzielono tak, że cztery piąte obrazów służy do nauki modeli, a jedna piąta jest odłożona, by przetestować, jak dobrze system uogólnia się na nowe przypadki.

Wiele „oczu” zamiast jednego

Zamiast polegać na pojedynczym modelu głębokiego uczenia, w badaniu wytrenowano cztery popularne sieci konwolucyjne, które pierwotnie powstały na dużym zbiorze codziennych zdjęć. Modele te, znane w tej dziedzinie jako VGG16, VGG19, ResNet50 i DenseNet121, zostały ponownie nauczone rozpoznawania siatkówki zdrowej i chorej. Każdy z nich samodzielnie osiąga już bardzo dobre wyniki, poprawnie klasyfikując około 98 procent obrazów testowych i pomijając tylko niewielką liczbę chorych oczu. Kluczową ideą pracy jest połączenie ich mocnych stron za pomocą kilku schematów łączenia decyzji, w tym prostego głosowania, uśrednienia pewności oraz bardziej zaawansowanych reguł inspirowanych logiką rozmytą.

Figure 2. W jaki sposób poprawione obrazy oka przechodzą przez wiele sieci AI, a ich złączone sygnały decydują o chorobie lub zdrowiu.

Łączenie opinii modeli z rozwagą

Zespół systematycznie bada siedem sposobów łączenia wyjść czterech modeli, zawsze przy tym samym przepisie treningowym. Dodatkowo dopracowują punkt odcięcia, przy którym prawdopodobieństwo jest przekształcane w decyzję tak/nie, zamiast zakładać stały próg połowiczny. Przeskanowawszy wiele progów, mierzą, jak dokładność, czułość i precyzja się równoważą, co ma kluczowe znaczenie dla narzędzi przesiewowych, które muszą unikać zarówno pominięć choroby, jak i nadmiernych fałszywych alarmów. Analizują też coś więcej niż zwykłą dokładność — oceniają, jak pewnie modele rozdzielają obrazy zdrowe od chorych, stosując krzywe ROC i wykresy gęstości prawdopodobieństwa.

Co wyniki oznaczają dla przyszłych badań przesiewowych oczu

W całym badaniu metody zespołowe zachowują lub nieznacznie poprawiają już silne wyniki pojedynczych modeli, osiągając około 98,6 procent dokładności i bardzo wysoką zdolność separacji klas. Proste schematy, takie jak głosowanie większościowe czy uśrednianie wartości pewności, okazują się wyjątkowo stabilne, podczas gdy jedna z metod rozmytych jest bardziej wrażliwa na wybory projektowe i daje mniej zrównoważone wyniki. Dla laika główne przesłanie jest takie, że połączenie kilku dobrze wytrenowanych „czytelników” obrazów, po starannym oczyszczeniu zdjęć i dostrojeniu sposobu łączenia ich głosów, prowadzi do bardziej godnego zaufania asystenta zautomatyzowanego. Takie narzędzie nie zastąpi okulistów, ale może pomóc im szybko segregować duże liczby fotografii siatkówki, koncentrując cenny czas kliniczny na pacjentach, których oczy wykazują wczesne oznaki problemów.

Cytowanie: Aiche, I., Brik, Y., Attallah, B. et al. RDE-DR: robust deep ensemble CNNs for automated diabetic retinopathy detection from fundus images. Sci Rep 16, 15226 (2026). https://doi.org/10.1038/s41598-026-48669-y

Słowa kluczowe: retinopatia cukrzycowa, obrazowanie dna oka, głębokie uczenie, modele zespołowe, badania przesiewowe w medycynie