Clear Sky Science · pl

R3MV: nowa niezawodna architektura systemu do klasyfikacji raka skóry z użyciem progresywnego heterogenicznego modelu wieloblokowego

· Powrót do spisu

Dlaczego to badanie ma znaczenie dla Twojej skóry

Rak skóry należy do najczęstszych nowotworów na świecie, a wczesne wykrycie często decyduje o rozbieżności między prostym zabiegiem a chorobą zagrażającą życiu. Dermatolodzy coraz częściej sięgają po sztuczną inteligencję (AI), aby pomóc w wykrywaniu niebezpiecznych znamion na zdjęciach wykonanych aparatami i dermoskopami. Jednak gdy różne systemy AI nie zgadzają się co do tej samej zmiany skórnej, któremu z nich można zaufać? W tym badaniu zaproponowano nowy sposób łączenia kilku punktów widzenia AI w jedną, bardziej niezawodną decyzję o tym, czy zmiana jest nowotworowa.

Figure 1
Figure 1.

Problem z poleganiem na pojedynczym inteligentnym systemie

Większość obecnych narzędzi AI do rozpoznawania raka skóry działa przez wytrenowanie jednego silnego modelu na jednym zbiorze danych. Systemy te mogą imponować w testach laboratoryjnych, jednak ich skuteczność często spada, gdy mają do czynienia ze zdjęciami z nowych klinik, innych aparatów czy od różnych grup pacjentów. Wcześniejsze oceny w dermatologii wskazywały na słabą walidację zewnętrzną i ograniczoną uogólnialność: modele działające dobrze na jednym starannie dobranym zbiorze mogą zawodzić w rzeczywistych warunkach szpitalnych. Ponieważ błędna odpowiedź może opóźnić leczenie lub spowodować niepotrzebne biopsje, autorzy argumentują, że poleganie na jednym modelu jest ryzykowne przy decyzjach klinicznych.

Nowy system wielogłosowego głosowania

Aby to rozwiązać, badacze proponują trójpoziomową architekturę nazwaną R3MV, skrót od niezawodnego systemu większościowego na trzech poziomach. Zamiast pytać jeden model AI o odpowiedź, R3MV uruchamia to samo zdjęcie skóry przez trzy różne ścieżki decyzyjne. Pierwsza ścieżka wykorzystuje głęboką splotową sieć neuronową, która bezpośrednio klasyfikuje obraz. Druga ścieżka przekazuje cechy z kilku różnych głębokich sieci, scala wykryte wzorce i przekazuje te skondensowane cechy do tradycyjnego klasyfikatora. Trzecia ścieżka analizuje przewidywania wielu pojedynczych modeli i trenuje kolejny klasyfikator na tych wynikach. Na koniec system stosuje większościowe głosowanie między trzema ścieżkami, więc ostateczny werdykt odzwierciedla konsensus, a nie pojedynczą opinię.

Inteligentniejszy sposób odczytu obrazów skóry

W sercu pierwszej ścieżki znajduje się niestandardowy model obrazowy nazwany Progressive Heterogeneous Multi‑Block CNN (PHMBCNN). Sieć ta zbudowana jest z kilku wyspecjalizowanych bloków, z których każdy uwypukla inne aspekty wizualne zmiany, takie jak drobne tekstury czy szersze struktury, w sposób progresywny od płytkich do głębokich warstw. Autorzy dodatkowo wzbogacili ten model o Gated Recurrent Unit (GRU), rodzaj modułu pamięci, który pomaga sieci uchwycić relacje między kanałami i warstwami. Ulepszona wersja, PHMBCNN‑GRU, pełni rolę mocnego samodzielnego klasyfikatora oraz istotnego źródła cech dla pozostałych ścieżek w systemie.

Pozwalając wielu modelom uczyć się razem

Druga ścieżka koncentruje się na łączeniu mocnych stron różnych sieci obrazowych. To samo zdjęcie zmiany przechodzi przez PHMBCNN‑GRU oraz przez kilka popularnych, wstępnie wytrenowanych modeli opracowanych pierwotnie dla fotografii ogólnej. Każdy model wydobywa własny wysokowymiarowy „odcisk” zmiany. Te odciski są łączone, a następnie kompresowane przy użyciu technik usuwających redundantne lub nieprzydatne informacje, zachowując jedynie najbardziej informatywne cechy. Wielowarstwowy perceptron, klasyczna sieć neuronowa z warstwami, uczy się potem klasyfikować zmiany na podstawie tego oczyszczonego, wspólnego opisu, skutecznie łącząc to, co każdy model „widzi”, w jednolitszy, ostrzejszy obraz.

Figure 2
Figure 2.

Przekształcanie niezgodności w silniejszą odpowiedź

Trzecia ścieżka, nazwana fuzją na poziomie decyzji, przyjmuje jeszcze wyższy poziom spojrzenia. Tutaj autorzy traktują etykietę przewidywaną przez każdy model jako wejście i uczą maszynę wektorów nośnych (SVM) rozpoznawania wzorców w zgodach i niezgodach modeli. Ten meta‑klasyfikator uczy się na przykład, kiedy określone kombinacje modeli zazwyczaj wskazują na zmianę łagodną, albo kiedy konkretny model ma tendencję do błędów dla określonych typów zmian. W całym systemie badacze starannie przetwarzali obrazy — zmianiali rozmiary, usuwali artefakty włosów i wyrównywali klasy — aby lepiej odzwierciedlić złożoną rzeczywistość obrazów klinicznych wykonywanych zarówno dermoskopami, jak i smartfonami.

Jak system sprawdza się w praktyce

Zespół przetestował swoje podejście na dwóch powszechnie używanych zbiorach obrazów raka skóry: HAM10000, zawierającym wysokiej jakości obrazy dermoskopowe z ośrodków klinicznych, oraz PAD_UFES_20, obejmującym zdjęcia ze smartfonów z silniejszymi artefaktami, takimi jak gęste włosy czy ślady atramentu. Ulepszony model PHMBCNN‑GRU samodzielnie poprawił dokładność w porównaniu z wersją bazową na obu zbiorach. Co ważniejsze, gdy wszystkie trzy ścieżki połączono przez głosowanie większościowe w systemie R3MV, wydajność wzrosła jeszcze bardziej, osiągając około 99% dokładności na HAM10000 oraz około 82% na PAD_UFES_20. Usuwanie włosów z obrazów zmian również konsekwentnie poprawiało wyniki, co pokazuje, jak istotne jest staranne oczyszczanie obrazu dla zautomatyzowanej diagnostyki.

Co to oznacza dla przyszłych kontroli skóry

Dla osób niebędących specjalistami kluczowy przekaz jest taki, że ta praca przesuwa AI w diagnostyce raka skóry od pojedynczej „czarnej skrzynki” w kierunku panelu niezależnych „opinii”, które muszą się zgodzić, zanim oznaczą zmianę jako podejrzaną. Choć R3MV nie rozwiązuje w pełni wyzwania, jak sprawić, by jeden system działał równie dobrze we wszystkich klinikach i przy różnych typach aparatów, pokazuje, że mieszanie różnych modeli i głosowanie między nimi może dać bardziej wiarygodne odpowiedzi niż poleganie na jednym rozwiązaniu. Z czasem takie systemy wielo‑ścieżkowe mogłyby wspierać dermatologów, oferując stabilniejsze, bardziej wyjaśnialne i godne zaufania oceny, które zmiany skórne wymagają bliższej uwagi lub biopsji.

Cytowanie: Reshma, S.K., Reeja, S.R. R3MV: a novel reliable system architecture for skin cancer classification using progressive heterogeneous multiblock model. Sci Rep 16, 13599 (2026). https://doi.org/10.1038/s41598-026-40522-6

Słowa kluczowe: wykrywanie raka skóry, AI w dermatologii, zbiory modeli głębokiego uczenia, analiza obrazów medycznych, wspomagane komputerowo diagnozowanie