Clear Sky Science · pl

SwinCup-DiscNet: Ramy transformera łączące cechy tarczy i kubka do diagnostyki jaskry

· Powrót do spisu

Dlaczego to ma znaczenie dla ratowania wzroku

Jaskra jest jedną z głównych przyczyn nieodwracalnej ślepoty na świecie, a mimo to często postępuje po cichu, bez bólu czy wczesnych objawów. Okuliści potrafią wychwycić subtelne zmiany w tylnej części oka zanim utraci się wzrok, ale ręczna ocena wszystkich pacjentów jest powolna i bywa niejednolita. W artykule przedstawiono SwinCup-DiscNet — nowy system sztucznej inteligencji (AI), który analizuje zdjęcia siatkówki, by wcześnie wykrywać jaskrę, łącząc klasyczne kliniczne wskazówki z nowoczesnym głębokim uczeniem.

Figure 1
Figure 1.

Patrząc na nerw wewnątrz oka

Aby zrozumieć działanie systemu, warto wiedzieć, jak zwykle wykrywa się jaskrę. Specjaliści badają tarczę nerwu wzrokowego — miejsce, w którym nerw przenoszący informacje wzrokowe opuszcza oko. W centrum tej „tarczy” znajduje się jaśniejsze zagłębienie zwane „kubkiem”. W miarę postępu jaskry kubek zwykle pogłębia się i poszerza, wżerając się w otaczający pierścień tkanki nerwowej. Kluczową miarą jest stosunek kubka do tarczy (cup-to-disc ratio), porównujący wielkość kubka do tarczy. Wyższy stosunek często wskazuje uszkodzenie. Ręczne mierzenie tego wskaźnika na tysiącach zdjęć siatkówki jest uciążliwe, a nawet eksperci mogą się różnić w ocenie. SwinCup-DiscNet automatyzuje zarówno pomiar tego stosunku, jak i ogólną ocenę, czy oko prawdopodobnie ma jaskrę.

Dwutorowe AI, które widzi szczegóły i szerszy kontekst

System działa dwutorowo po otrzymaniu obrazu dna oka. Po pierwsze, gałąź segmentacyjna wyodrębnia tarczę i centralny kubek. Wykorzystuje wyspecjalizowaną sieć zwaną Attention U-Net, która uczy się uwydatniać istotne struktury i ignorować rozpraszające elementy tła, takie jak naczynia krwionośne czy artefakty oświetlenia. Gdy zidentyfikuje granice kubka i tarczy, system wygładza je i dopasowuje czyste elipsy, a następnie mierzy ich pionowe rozmiary, by obliczyć pionowy stosunek kubka do tarczy — klinicznie zaufany wskaźnik jaskry.

Nauka wzorców wykraczających poza to, co można zmierzyć wzrokiem

W drugim torze gałąź oparta na transformerze analizuje cały obraz bez koncentracji na pojedynczej miarze. Ta gałąź używa Swin Transformera, nowoczesnego modelu głębokiego uczenia, który dzieli obraz na małe łatki i bada ich relacje w całej siatkówce. Dzięki temu wychwytuje subtelne wzorce tekstury, koloru i struktury wokół nerwu wzrokowego i sąsiednich obszarów, które mogą być związane z jaskrą, ale trudno je ująć ilościowo przez człowieka. Z tej globalnej perspektywy model generuje prawdopodobieństwo, że obraz pochodzi od osoby z jaskrą.

Figure 2
Figure 2.

Łączenie zaufanych wskazówek z intuicją AI

Sednem SwinCup-DiscNet jest sposób łączenia tych dwóch źródeł dowodów. Zamiast polegać wyłącznie na stosunku kubka do tarczy lub wyłącznie na prawdopodobieństwie z transformera, system miesza je za pomocą reguły ważonej. Stosunek kubka do tarczy jest normalizowany na podstawie zachowania w danych treningowych, a następnie łączony z wyuczonym prawdopodobieństwem jaskry w jeden wynik. Jeśli ten zintegrowany wynik przekracza próg, oko klasyfikowane jest jako jaskrowe; w przeciwnym razie oznaczane jest jako prawidłowe. Takie rozwiązanie zakotwicza decyzję w znanym pomiarze klinicznym, jednocześnie korzystając z bogatszych wzorców wykrywanych przez AI. System dodatkowo nakłada dopasowane obrysy tarczy i kubka na oryginalny obraz, dając lekarzom klarowną wizualizację obszaru, który wpłynął na ocenę.

Sprawdzanie metody w praktyce

Autorzy ocenili SwinCup-DiscNet na trzech powszechnie używanych publicznych zbiorach obrazów siatkówki: LAG, ACRIMA i DRISHTI-GS. Kolekcje te różnią się typem aparatu, jakością obrazów i mieszanką pacjentów, co czyni je wymagającym polem testowym. We wszystkich przypadkach nowy system dorównywał lub przewyższał tradycyjne sieci konwolucyjne oraz metody wykorzystujące wyłącznie segmentację kubka i tarczy. Osiągnął bardzo wysoką jakość segmentacji, niskie błędy w estymacji stosunku kubka do tarczy oraz dokładności klasyfikacji bliskie lub przekraczające 99 procent, z mocnymi krzywymi wydajności wskazującymi, że rzadko myli oczy zdrowe z chorymi. Analiza błędów wykazała, że większość pozostałych fałszywych alarmów dotyczyła przypadków granicznych, gdzie kubek był naturalnie duży, ale nie chorobowy — kompromis często akceptowalny w badaniach przesiewowych.

Co to oznacza dla przyszłych badań przesiewowych wzroku

Mówiąc prosto, SwinCup-DiscNet pokazuje, że AI potrafi zarówno „myśleć jak lekarz”, wykorzystując ustalone markery takie jak stosunek kubka do tarczy, jak i „dostrzegać więcej”, ucząc się złożonych wzorców na obrazach siatkówki. Łącząc te zalety, system dostarcza dokładniejsze i bardziej interpretowalne badania przesiewowe pod kątem jaskry niż wiele istniejących podejść. Przy dalszych testach na danych z rzeczywistych szpitali i ewentualnych rozszerzeniach do stopniowania nasilenia choroby, tego typu hybrydowe AI mogłoby stać się praktycznym wsparciem w klinikach okulistycznych, pomagając wykrywać jaskrę wcześniej i zapobiegać możliwej do uniknięcia utracie wzroku.

Cytowanie: Chilukuri, R., Praveen, P., Gatla, R.K. et al. SwinCup-DiscNet: A fusion transformer framework for glaucoma diagnosis using optic disc and cup features. Sci Rep 16, 7920 (2026). https://doi.org/10.1038/s41598-026-39065-7

Słowa kluczowe: jaskra, obrazowanie siatkówki, głębokie uczenie, nerw wzrokowy, badania przesiewowe medyczne