Clear Sky Science · pl

Ulepszona klasyfikacja raka skóry dla klas mniejszościowych przy użyciu potoku Conditional GAN i zespołu CNN‑ViT

2026-03-11 · Powrót do spisu

Dlaczego mądrzejsze badania skóry mają znaczenie

Rak skóry jest jednym z najczęstszych nowotworów na świecie, a wczesne wykrycie może oznaczać różnicę między prostym zabiegiem ambulatoryjnym a chorobą zagrażającą życiu. Dermatolodzy w dużej mierze polegają na wskazówkach wizualnych w powiększonych obrazach skóry, ale nawet eksperci mają trudności, gdy niektóre typy nowotworów są rzadkie, a zdjęcia zasłaniają rozpraszające detale, takie jak włosy. W tym badaniu wprowadzono system sztucznej inteligencji zaprojektowany do obsługi tych trudnych, niedoreprezentowanych przypadków w sposób bardziej sprawiedliwy, z zamiarem wspierania bardziej niezawodnego przesiewu raka skóry dla wszystkich.

Nierównomierne dane i trudno dostrzegalne nowotwory

Obrazy dermatologiczne stawiają przed komputerami i klinicystami kilka przeszkód. Wiele zdjęć pokazuje włosy, cienie i inne artefakty, które zasłaniają samą zmianę. Niektóre nowotwory skóry są bardzo częste, inne zaś rzadkie, dlatego główne publiczne zbiory zawierają tysiące przykładów zmian łagodnych, a jedynie kilkaset zdjęć rzadziej występujących, lecz klinicznie istotnych nowotworów. Standardowe modele głębokiego uczenia trenowane na tak nierównych zbiorach mają tendencję do bardzo dobrego rozpoznawania klas większościowych, przy jednoczesnym cichym zawodzeniu na klasach rzadkich — właśnie w tych przypadkach automatyczna pomoc byłaby najcenniejsza. Dodatkowo konwencjonalne sieci obrazowe często skupiają się na małych fragmentach i mogą przeoczyć globalne wskazówki, takie jak ogólna asymetria czy nieregularne brzegi, które mają znaczenie diagnostyczne.

Wykorzystywanie rzadkich przypadków

Aby poradzić sobie z nierównowagą, autorzy najpierw budują inteligentny generator obrazów, który uczy się na podstawie rzeczywistych danych pacjentów, a następnie tworzy nowe, realistycznie wyglądające przykłady rzadkich typów zmian. Zamiast prostego odbijania czy obracania istniejących zdjęć, ich system — warunkowa sieć generatywna typu adversarial (Conditional GAN) — wykorzystuje „mapy uwagi” uzyskane z klasyfikatora standardowego, aby zobaczyć, które części każdej zmiany najbardziej wpływały na wcześniejsze decyzje. Te mapy uwagi podkreślają medycznie istotne obszary. Generator następnie tworzy nowe obrazy, które zachowują krytyczne struktury wewnątrz tych stref, jednocześnie wprowadzając kontrolowane zmiany w kolorze, fakturze i kształcie. W praktyce AI uczy się wyobrażać sobie wiele prawdopodobnych wariantów każdego rzadkiego nowotworu, wzbogacając zbiór treningowy bez bezpośredniego kopiowania obrazów.

Dwa sposoby widzenia: lokalne detale i globalne wzorce

Gdy zbiór danych zostaje zrównoważony przy użyciu tych celowanych obrazów syntetycznych, drugi moduł AI przejmuje zadanie postawienia diagnozy. Badacze łączą tu dwa uzupełniające się typy modeli. Konwolucyjna sieć neuronowa (ResNet50V2) doskonale wychwytuje drobne, lokalne wskazówki — maleńkie smugi pigmentu, subtelną teksturę i ostrość krawędzi. Równolegle model transformera wzrokowego (DeiT) traktuje każdy obraz jako siatkę łatek i uczy się, jak odległe regiony odnoszą się do siebie nawzajem, wyłapując cechy obejmujące całe zmiany, takie jak symetria, rozległość i kształt brzegu. Zamiast czekać do końca z połączeniem ich wyników, zespół scala ich wewnętrzne reprezentacje za pomocą modułu fuzji opartego na uwadze, co pozwala, by kontekst globalny podkreślał lub osłabiał konkretne cechy lokalne w locie.

Testowanie systemu

Potok oceniono na zbiorze HAM10000, szeroko stosowanej kolekcji ponad dziesięciu tysięcy obrazów dermoskopowych obejmujących siedem typów zmian, od nieszkodliwych plam pigmentowych po czerniaka i kilka rzadszych nowotworów skóry. Po usunięciu włosów i starannym podziale na zbiory treningowe i testowe, nowe obrazy syntetyczne są mieszane z oczyszczonymi oryginałami w celu utworzenia zrównoważonego zbioru treningowego. Wydajność połączonego modelu oceniano za pomocą miar precyzji, recall (czułości) i F1 dla każdej klasy, a także krzywych ROC i precyzja‑czułość. Kluczowe było skupienie się na tym, czy rzadkie klasy, takie jak dermatofibroma, zmiany naczyniowe, rak podstawnokomórkowy i keratoza aktiniczna, są rozpoznawane z taką samą niezawodnością jak typy liczne, zamiast polegać na pojedynczym ogólnym wskaźniku dokładności, który mógłby ukryć słabości.

Bardziej zrównoważone odpowiedzi od AI

Opracowany system osiąga wysoką i, co ważniejsze, dobrze zrównoważoną skuteczność we wszystkich siedmiu klasach. Uzyskuje niemal doskonałe wyniki dla kilku mniejszościowych nowotworów oraz konkurencyjne wyniki dla pozostałych typów, jednocześnie wykazując niską niepewność statystyczną przy testach opartych na szerokim resamplingu bootstrap. Sugeruje to, że osiągnięcia nie są przypadkiem wynikającym z nadpróbkowania, lecz wynikają z synergii między generowaniem obrazów kierowanym uwagą a klasyfikatorem o dwóch perspektywach. Dla laików kluczowy komunikat jest taki, że mądrzejszy projekt AI — a nie tylko większe modele — może pomóc zapewnić, że narzędzia do automatycznego wykrywania raka skóry nie przeoczą rzadkich, lecz niebezpiecznych schorzeń. Choć przed wdrożeniem klinicznym potrzebne są dalsze testy na szerszych, wieloośrodkowych zbiorach, praca ta wskazuje na asystentów AI, którzy traktują każdą zmianę skórną, powszechną czy rzadką, z równą uwagą.

Cytowanie: Hussain, S.R., Saritha, S., Chevuri, A. et al. Enhanced skin cancer classification for minority classes using Conditional GAN pipeline and CNN-ViT ensemble. Sci Rep 16, 13114 (2026). https://doi.org/10.1038/s41598-026-43339-5

Słowa kluczowe: wykrywanie raka skóry, AI w obrazowaniu medycznym, nierównowaga klas, syntetyczne obrazy medyczne, transformery wzrokowe