Clear Sky Science · pl
Wielomodalny zbiór obrazów siatkówki do wykrywania retinopatii cukrzycowej przy użyciu modeli bazowych
Dlaczego wczesne wykrycie uszkodzeń oka ma znaczenie
Dla osób z cukrzycą uszkodzenia tkanki światłoczułej z tyłu oka mogą przez lata postępować bezobjawowo, zanim wzrok wyraźnie się pogorszy. Gdy pojawiają się objawy, część szkód może być nieodwracalna. Lekarze wiedzą, że regularne badania oka potrafią wykryć problemy wcześnie, ale ręczne przeglądanie tysięcy zdjęć jest powolne i kosztowne. Niniejsze badanie przedstawia dużą, starannie opisną kolekcję obrazów siatkówki, zaprojektowaną, by pomóc systemom sztucznej inteligencji lepiej i bardziej wiarygodnie wykrywać okulistyczne powikłania cukrzycy, dostarczając wcześniejszych ostrzeżeń większej liczbie pacjentów.

Różne ujęcia tego samego problemu
Lekarze okulistyki używają kilku typów aparatów, by poszukiwać zmian związanych z cukrzycą. Standardowe kolorowe fotografie tylnej części oka pokazują okrągły, czerwonawy obraz, na którym mogą pojawiać się drobne krwotoki, złogi tłuszczowe i nowe kruche naczynia. Zdjęcia ultra‑szerokokątne obejmują znacznie większy obszar, łącznie z odległymi brzegami siatkówki, gdzie mogą ukrywać się wczesne uszkodzenia. Trzecie narzędzie, tomografia optyczna (OCT), przekraja siatkówkę w przekroju, ujawniając obrzęk i kieszonki płynu związane z zagrażającym wzrokowi obrzękiem plamki. Każda metoda pokazuje inne elementy tego samego procesu chorobowego, a razem dają pełniejszy obraz stanu oka.
Co nowego wnosi ta kolekcja obrazów
Istniejące publiczne zbiory danych napędziły wiele systemów AI do przesiewania chorób oczu, ale większość koncentruje się tylko na jednej metodzie obrazowania i oferuje jedynie ogólne oznaczenia, np. pojedynczą ocenę zaawansowania choroby. Niektóre zawierają szumy w etykietach lub pomijają ważne typy zmian, a wiele nie obejmuje dobrze obrazów szerokokątnych ani szczegółowych informacji o obrzęku plamki. Nowy zbiór MMRDR ma wypełnić te luki. Zgromadzono 24 460 obrazów z trzech modalności — standardowe zdjęcia kolorowe, obrazy ultra‑szerokokątne i skany OCT — i dodano szczegółowe adnotacje ekspertów. Dla zdjęć kolorowych i szerokokątnych lekarze oceniali całościowy stopień choroby na pięciostopniowej skali i zapisywali siedem konkretnych typów zmian, takich jak drobne wybrzuszenia naczyń, krwotoki i odwarstwienie siatkówki. Dla skanów OCT opisywali, czy obrzęk plamki jest nieobecny, występuje poza centrum, czy bezpośrednio dotyczy centrum widzenia.
Jak obrazy zostały wyselekcjonowane i oznaczone
Autorzy wybrali standardowe fotografie kolorowe z istniejącego publicznego zbioru konkursowego oraz pozyskali obrazy szerokokątne i OCT z dużego chińskiego szpitala okulistycznego, koncentrując się na osobach z cukrzycą. Usunęli obrazy niskiej jakości z rozmyciami, złym oświetleniem lub brakującymi centralnymi obszarami, aby pozostałe skany były użyteczne klinicznie. Czterech doświadczonych okulistów oraz starszy specjalista siatkówki opracowali jasne zasady oceny oparte na wytycznych międzynarodowych. Specjalista najpierw stworzył zestaw referencyjny obrazów, następnie pozostali oceniający trenowali na tym zbiorze, aż ich decyzje były zgodne z ekspertem. Potem niezależnie oznaczyli tysiące obrazów, a wątpliwe przypadki odsyłali z powrotem do specjalisty. Końcowa kolekcja łączy szczegółowe oznaczenia z wysoką zgodnością między lekarzami, co czyni ją wiarygodnym zbiorem treningowym dla AI.
Testowanie dzisiejszej AI na jutrzejszych danych okulistycznych
Zespół następnie wykorzystał zbiór do oceny kilku typów zaawansowanych modeli AI. Testowano duże modele wizualno‑językowe pierwotnie trenowane na ogólnych obrazach i tekście, standardowe klasyfikatory obrazów uczone na codziennych fotografiach oraz nowsze „modele bazowe” już dostrojone do obrazów oka. We wszystkich przypadkach modele miały największe trudności z obrazami ultra‑szerokokątnymi, gdzie znacznie większy widok i bardziej złożone wzorce obniżały dokładność w porównaniu ze standardowymi zdjęciami kolorowymi. Modele zaprojektowane specjalnie dla obrazów oka lepiej przenosiły wiedzę ze standardowych ujęć na szerokokątne niż ogólne systemy multimodalne, co sugeruje, że znajomość struktury siatkówki ma realne znaczenie. Po dostrojeniu jednego dużego modelu multimodalnego na MMRDR jego wydajność znacznie się poprawiła, pokazując, że ten zbiór potrafi nauczyć nawet bardzo elastyczne systemy AI radzenia sobie z chorobami oka bardziej kompetentnie.

Co to oznacza dla przyszłej opieki okulistycznej
Mówiąc prosto, ta praca dostarcza wysokiej jakości biblioteki treningowej dla komputerów uczących się wykrywać zmiany w oku związane z cukrzycą. Łącząc trzy uzupełniające się metody obrazowania i szczegółowe etykiety ekspertów, zbiór MMRDR pozwala badaczom tworzyć i rzetelnie porównywać narzędzia AI, które oceniają ciężkość choroby, lokalizują poszczególne zmiany i śledzą obrzęk plamki. Chociaż same obrazy nie wyleczą ślepoty, stanowią kluczową podstawę dla bardziej godnych zaufania zautomatyzowanych systemów przesiewowych, które mogłyby wykrywać zagrażające wzrokowi zmiany wcześniej i udostępniać opiekę okulistyczną na poziomie eksperckim większej liczbie osób z cukrzycą.
Cytowanie: Tang, Z., Wang, L., Guo, Z. et al. A multimodal retinal image dataset for diabetic retinopathy detection using foundation models. Sci Data 13, 639 (2026). https://doi.org/10.1038/s41597-026-07005-9
Słowa kluczowe: retinopatia cukrzycowa, obrazowanie siatkówki, sztuczna inteligencja w medycynie, modele bazowe, OCT oka