Clear Sky Science · pl

Kontekstowo-anatomiczne uczenie głębokie dla dokładnej segmentacji dołka środkowego w obrazach dna oka z retinopatią cukrzycową

2026-02-24 · Powrót do spisu

Dostrzec niebezpieczeństwo w oczach osób z cukrzycą

Dla milionów osób z cukrzycą małe miejsce dokładnie w centrum siatkówki — dołek środkowy — może oznaczać różnicę między ostrym widzeniem a trwałą utratą wzroku. Lekarze już dziś wykorzystują kolorowe zdjęcia tylnej części oka (obrazy dna oka) do przesiewowego wykrywania retinopatii cukrzycowej, jednej z głównych przyczyn możliwej do uniknięcia ślepoty. Jednak obecne narzędzia automatyczne zwykle oznaczają dołek jako pojedynczy punkt zamiast wykreślać jego rzeczywisty obszar, a to właśnie takie odwzorowanie jest potrzebne lekarzom, by zdecydować, kto wymaga wstrzyknięć, laseroterapii, a kto może bezpiecznie poczekać. Niniejsze badanie pokazuje, jak nowa, oparta na danych metoda sztucznej inteligencji (AI) może nauczyć się rozpoznawać dołek podobnie jak specjalista — zwracając uwagę na cały anatomiczny „mapę drogową” oka, a nie tylko na sam dołek.

Dlaczego dołek trudno jest obrysować

Dołek środkowy to malutkie, płytkie zagłębienie w siatkówce, odpowiadające za ostry widok centralny i bogate postrzeganie barw. Na obrazach dna oka jego granice są nieostre, wygląd różni się w zależności od aparatu, a choroba może dodatkowo je zamazywać. Tradycyjne metody komputerowe opierały się na prostych regułach dotyczących jasności i geometrii, które szybko zawodzą w obecności zmian chorobowych lub przy słabej jakości obrazu. Nowsze systemy głębokiego uczenia poprawiły wykrywanie dołka, ale zwykle traktują struktury oka osobno lub polegają na coraz bardziej złożonych architekturach sieci. Oba podejścia często pomijają podstawową kliniczną prawdę: okulista nie szuka dołka w izolacji — korzysta z punktów orientacyjnych, takich jak tarcza nerwu wzrokowego i układ naczyń krwionośnych, aby wywnioskować położenie dołka nawet wtedy, gdy jest słabo widoczny.

Nauczyć AI czytać mapę oka

Autorzy proponują inną strategię: zamiast tworzyć coraz bardziej skomplikowane architektury sieci, wzbogacają etykiety używane do trenowania standardowego, wydajnego modelu. Stworzyli nowy zbiór danych IDRiD-RETA-FV, w którym specjaliści okulistyki dokładnie narysowali obrysy na poziomie pikseli nie tylko dla dołka, lecz także dla tarczy nerwu wzrokowego, naczyń krwionośnych, obrębu siatkówki i tła. Dwóch okulistów przestrzegało ścisłego protokołu i osiągnęło niemal doskonałą zgodność oznaczeń, zapewniając solidny punkt odniesienia dla systemu AI. Do tego zbioru podłączyli model segmentacyjny MNv4Fovea, oparty na powszechnie stosowanej architekturze, ale trenowany do jednoczesnej segmentacji wszystkich struktur anatomicznych. Stopniowo dodając coraz więcej kontekstu do etykiet treningowych — najpierw tylko dołek kontra tło, następnie tarcza nerwu wzrokowego, potem siatkówka, a w końcu naczynia — mogli bezpośrednio zmierzyć, jak bardzo każda część anatomii pomaga modelowi zlokalizować dołek.

Jak kontekst i sprytne augmentacje podnoszą dokładność

Wyniki pokazują, że kontekst ma ogromne znaczenie. Gdy model uczył się tylko z etykietami dołka i tła, poprawnie zidentyfikował nieco ponad jedną czwartą pikseli dołkowych. Dodanie samej tarczy nerwu wzrokowego przyniosło jedynie umiarkowane korzyści. Ale gdy uwzględniono obrys siatkówki, wydajność gwałtownie wzrosła, a dodanie naczyń krwionośnych podniosło odzysk dołkowych pikseli powyżej 90 procent. Innymi słowy, gdy model AI otrzymał tę samą mapę drogową, z której korzystają lekarze — tarczę, naczynia i granicę siatkówki — stał się znacznie lepszy w obrysowywaniu dołka. Aby system działał na obrazach z różnych aparatów, zespół opracował też nowy sposób zmieniania koloru i jasności obrazu. Modelowali wygląd innych publicznych zbiorów oka przy użyciu rozkładu statystycznego zwanego uogólnionym rozkładem ekstremalnym (GEV) i przekształcali obrazy treningowe tak, by naśladowały te style przy jednoczesnym zachowaniu anatomii. Ta augmentacja oparta na GEV niemal podwoiła odsetek udanych wykryć dołka w porównaniu z samymi standardowymi modyfikacjami geometrycznymi.

Dowód działania na wielu zbiorach danych

MNv4Fovea przetestowano zarówno na nowym, ekspertowo oznakowanym zbiorze, jak i na kilku dobrze znanych publicznych kolekcjach obrazów siatkówki. Na wydzielonej części testowej IDRiD-RETA-FV osiągnął wysoki stopień pokrycia między przewidywanymi a rzeczywistymi obszarami dołka i zlokalizował środek dołka w odstępie zaledwie kilku pikseli — praktycznie zawsze wykrywając dołek, gdy był obecny. Na zewnętrznych zbiorach, takich jak MESSIDOR, REFUGE, ARIA i MAPLES-DR, model dorównał albo przewyższył metody będące ówczesnym stanem techniki pod względem bliskości przewidywań do punktów referencyjnych. Co ciekawe, w niektórych przypadkach wyniki liczbowe wydawały się umiarkowane, ponieważ zewnętrzne zbiory definiowały „dołek” inaczej — na przykład oznaczając szeroką strefę plamkową zamiast maleńkiego klinicznego dołka — jednak recenzja ekspertów wykazała, że przewidywania modelu były anatomicznie sensowne i często bliższe opinii specjalisty niż oryginalne etykiety.

Co to oznacza dla pacjentów i przyszłych narzędzi

Dla osób żyjących z cukrzycą badanie wskazuje drogę do bardziej wiarygodnych, szeroko wdrażalnych narzędzi przesiewowych, które robią więcej niż umieszczanie kropki na siatkówce. Ucząc się z pełnego kontekstu anatomicznego — tarczy, naczyń i obrysu siatkówki — zamiast polegać wyłącznie na trikach architektonicznych, MNv4Fovea potrafi precyzyjnie odwzorować obszar dołka, co jest kluczowym krokiem w ocenie, czy obrzęk lub zmiany chorobowe znajdują się na tyle blisko, by zagrażać widzeniu centralnemu. Autorzy twierdzą, że to podejście skoncentrowane na danych i prowadzone przez anatomię może uzupełniać przyszłe postępy w projektowaniu sieci oraz że podobne strategie mogą przynieść korzyści w wielu innych obszarach obrazowania medycznego, gdzie subtelne struktury trzeba odnaleźć w złożonych, chorobowo zmienionych pejzażach.

Cytowanie: Chankhachon, S., Kansomkeat, S., Bhurayanontachai, P. et al. Contextual anatomy-guided deep learning for accurate fovea segmentation in diabetic retinopathy fundus images. Sci Rep 16, 10388 (2026). https://doi.org/10.1038/s41598-026-40287-y

Słowa kluczowe: retinopatia cukrzycowa, obrazowanie siatkówki, segmentacja dołka środkowego, uczenie głębokie, analiza obrazów medycznych