Clear Sky Science · pl
Dokładna klasyfikacja zmian skórnych na niezrównoważonych obrazach dermoskopowych o dużej zmienności za pomocą ramy SCTFD
Dlaczego inteligentniejsze badania skóry są ważne
Rak skóry jest jednym z najczęstszych nowotworów, ale także jednym z najlepiej rokujących, jeśli zostanie wykryty wcześnie. Dermatolodzy coraz częściej polegają na zbliżonych zdjęciach znamion i plam, wykonanych za pomocą ręcznego lupy zwanej dermatoskopem, aby ocenić, które z nich są niebezpieczne. Odczytywanie tych obrazów jest jednak trudne, nawet dla ekspertów, a systemy komputerowe, które mogłyby w tym pomóc, często zawodzą, ponieważ niektóre typy nowotworów są rzadkie, a zmiany mogą wyglądać bardzo różnie u różnych pacjentów. W tym badaniu przedstawiono nową ramę sztucznej inteligencji (AI) nazwaną SCTFD, zaprojektowaną tak, aby zwiększać dokładność i niezawodność komputerowej klasyfikacji zmian skórnych właśnie w takich trudnych warunkach.

Wyzwanie rzadkich i trudnych zmian skórnych
Zbiory rzeczywistych obrazów skóry są dalekie od zrównoważonych. Powszechne, przeważnie niegroźne znamiona występują tysiące razy w danych treningowych, podczas gdy poważne nowotwory, takie jak czerniak czy rzadkie guzy, pojawiają się tylko kilkaset razy lub mniej. Jednocześnie zmiany tej samej choroby mogą różnić się rozmiarem, kolorem i kształtem. Standardowe systemy AI mają tendencję do nadmiernego dopasowywania się do powszechnych wzorców i pomijania rzadkich, co w medycynie jest niebezpieczne: lepiej przeoczyć niegroźne znamie niż czerniaka. Klasyczne strategie, takie jak proste kopiowanie rzadkich obrazów, mieszanie ich ze sobą czy używanie złożonych modeli generatywnych, mają ograniczenia związane z realistycznością, stabilnością lub kosztem obliczeniowym. SCTFD został stworzony specjalnie, aby radzić sobie z tym nierównomiernym rozkładem i zmiennością, zachowując jednocześnie efektywność wystarczającą do praktycznego zastosowania.
Tworzenie lepszych przykładów treningowych
Pierwszym elementem SCTFD jest generator danych o nazwie CN-SMOTE. Zamiast jedynie interpolować wartości pikseli lub trenować kruchą sieć generatywną przeciwdziałającą (GAN), CN-SMOTE wykorzystuje parę enkoder–dekoder: jedna sieć kompresuje obraz dermoskopowy do zwartego wewnętrznego kodu, a druga rekonstruuje go z powrotem do obrazu. Po nauczeniu się tej zwartej przestrzeni metoda wyszukuje bliskich sąsiadów wśród zmian z rzadkich klas i interpoluje pomiędzy ich kodami, następnie dekoduje te zmieszane kody z powrotem do nowych obrazów. Specjalna kara w trakcie treningu utrzymuje wewnętrzne kody zmian tego samego typu blisko siebie, dzięki czemu obrazy syntetyczne pozostają realistyczne i wierne podstawowej chorobie. Efektem jest większy, bardziej zrównoważony zbiór obrazów dermoskopowych, w którym rzadkie, lecz istotne typy zmian są lepiej reprezentowane.
Widzieć zarówno szczegóły, jak i całość
Drugi komponent, MARD-Net, koncentruje się na przekształceniu każdego obrazu w bogaty zestaw charakterystycznych cech. Warstwy splotowe działają jak regulowane lupy, wychwytując drobne wzorce, takie jak brzegi i tekstury. Na to nakłada się moduł uwagi, który uczy sieć skupiać się na małym obszarze, gdzie faktycznie znajduje się zmiana, marginalizując otaczającą zdrową skórę, która mogłaby rozpraszać model. Wreszcie etap oparty na Transformerze analizuje całe zdjęcie, aby uchwycić relacje między odległymi częściami zmiany, na przykład układ różnych kolorów i struktur. Aby uniknąć dużych kosztów obliczeniowych zwykle związanych z Transformerami, autorzy wprowadzają strategię przesuwnego okna, która pozwala modelowi uzyskać szeroki wgląd w zmianę przy jednoczesnym wykonywaniu skoncentrowanych obliczeń uwagi w wybranych regionach, co czyni go szybszym i bardziej oszczędnym pamięciowo.

Skierowanie modelu, by traktował każdą klasę sprawiedliwie
Trzeci filar SCTFD to nowy cel treningowy zwany FDLoss, który mówi AI, jak ma się dostosowywać podczas uczenia. Zamiast traktować każdy obraz jednakowo, FDLoss kładzie nacisk na trudne i rzadkie przypadki, dzięki czemu model nie może „przepychać się” osiągając dobre wyniki tylko na licznych, łatwych przykładach. Łączy on pomysły z dwóch popularnych reguł oceniania: jednej nagradzającej dobre wyważenie czułości i precyzji oraz drugiej obniżającej wagę trywialnych przykładów, które sieć już poprawnie klasyfikuje. Dodatkowo FDLoss zawiera składnik zachęcający, aby obrazy tej samej choroby tworzyły zwarte grupy w wewnętrznej przestrzeni modelu, jednocześnie oddalając choroby różne od siebie. To połączenie bezpośrednio przeciwdziała zarówno nierównowadze klas, jak i dużej zmienności w ramach każdej klasy, które zwykle mylą klasyfikatory.
Jak dobrze działa nowe podejście
Autorzy przetestowali SCTFD na dwóch szeroko stosowanych międzynarodowych benchmarkach obrazowania skóry, ISIC 2018 i ISIC 2019, które zawierają dziesiątki tysięcy rzeczywistych klinicznych obrazów dermoskopowych obejmujących odpowiednio siedem i osiem typów zmian, i są silnie przesunięte w kierunku powszechnych znamion. W porównaniu z kilkoma metodami będącymi stanem wiedzy, SCTFD osiągnął wyższą dokładność i zauważalnie lepszą równowagę między wykrywaniem prawdziwych pozytywów a unikaniem fałszywych alarmów. Poprawił ogólną dokładność do około 93% na ISIC 2018 i 91% na ISIC 2019 oraz podniósł miarę F1 — mierzącą równowagę między pominięciami a błędnymi etykietami — powyżej wszystkich konkurencyjnych systemów. Wizualizacje pokazały, że moduły uwagi skupiają się wyraźnie na obszarach zmian, a cechy pochodzące z różnych chorób stają się po treningu wyraźniej rozdzielone.
Co to oznacza dla pacjentów i lekarzy
Dla pacjentów obietnicą SCTFD jest bardziej wiarygodna druga opinia, gdy na skórze pojawi się podejrzana plama. Dzięki syntezowaniu realistycznych przykładów rzadkich nowotworów, koncentracji na najbardziej informatywnych częściach każdego obrazu oraz treningowi z funkcją straty wymuszającą wyraźne rozdzielenie typów chorób, ramy te zmniejszają ryzyko, że systemy automatyczne przeoczą niebezpieczne zmiany tylko dlatego, że są rzadkie lub nietypowe. Choć nie zastępuje to oceny dermatologa, podejście to może obniżyć barierę wczesnej, dokładnej diagnozy w klinikach i platformach telemedycznych, potencjalnie wykrywając zagrażające życiu nowotwory skóry wcześniej i bardziej konsekwentnie.
Cytowanie: Li, X., Ouyang, J., Chen, Y. et al. Accurate skin lesion classification on imbalanced dermoscopic images with high variance via the SCTFD framework. Sci Rep 16, 12302 (2026). https://doi.org/10.1038/s41598-026-37846-8
Słowa kluczowe: wykrywanie raka skóry, dermoskopia AI, klasyfikacja obrazów medycznych, nierównomierne zbiory danych, uczenie głębokie w dermatologii