Clear Sky Science · pl

Modelowanie hybrydowego zespołu głębokiego uczenia do wykrywania zmian skórnych z wykorzystaniem odszumiania FCNN i inception-dilated ResNetV2

2026-04-02 · Powrót do spisu

Dlaczego to ma znaczenie dla codziennego zdrowia

Rak skóry jest jednym z najczęstszych nowotworów na świecie, a mimo to wiele zmian skórnych pozostaje nierozpoznanych, dopóki nie staną się groźne. Badanie to analizuje, jak zaawansowane systemy komputerowe mogą pomóc lekarzom wcześniej i bardziej wiarygodnie wykrywać niepokojące zmiany skórne, ucząc się na tysiącach zdjęć — co może odciążyć zapracowane przychodnie i zwiększyć szanse na terminowe leczenie.

Nauczanie komputerów „czytania” zdjęć skóry

Badacze skupiają się na obrazach dermoskopowych — zbliżeniach, które ukazują drobne detale znamion i innych zmian. Interpretacja takich zdjęć jest trudna nawet dla wyszkolonych specjalistów, zwłaszcza gdy obrazy zawierają włosy, cienie lub szum z aparatu. Zespół dąży do stworzenia wspomaganego komputerowo systemu diagnostycznego, który potrafi rozróżnić różne rodzaje zmian skórnych, w tym czerniaka, z wysoką dokładnością, radząc sobie jednocześnie z niedoskonałą i zróżnicowaną jakością obrazów z prawdziwego świata.

Figure 1. W jaki sposób inteligentny proces obrazowania przekształca zaszumione zdjęcia skóry w czytelne grupy typów zmian.

Oczyszczanie obrazu przed wydaniem opinii

Pierwszym krokiem w ich systemie jest oczyszczenie każdego zdjęcia skóry przy użyciu typu sieci neuronowej przeznaczonej do naprawy obrazów. Model uczy się usuwać plamki, artefakty i inne zanieczyszczenia wizualne, zachowując jednocześnie krawędzie i tekstury definiujące kształt oraz kolor zmiany. Trenując na wielu powiązanych obrazach jednocześnie i porównując podobne obszary między nimi, metoda generuje wyraźniejszą wersję zmiany skórnej. Dzięki temu wejście jest czystsze, co zmniejsza ryzyko, że włosy, odblaski czy faktura tła wprowadzą w błąd kolejne etapy algorytmu.

Wyszukiwanie ukrytych wzorców na wielu skalach

Gdy obrazy zostaną odszumione, druga głęboka sieć poszukuje wzorców, które mogą umknąć ludzkim oczom. Sieć ta jest skonstruowana tak, aby wychwytywać zarówno drobne detale, jak i szersze wzory, na przykład ogólne rozproszenie koloru. Osiąga to poprzez stosowanie filtrów o różnych rozmiarach i specjalnej architektury, która pozwala zobaczyć zarówno lokalne szczegóły, jak i szerszy kontekst bez nadmiernego wzrostu kosztów obliczeniowych. Połączenia rezydualne ułatwiają przepływ informacji przez liczne warstwy, dzięki czemu model może budować bogate opisy każdej zmiany, nie tracąc istotnych wskazówek wizualnych.

Figure 2. W jaki sposób oczyszczone obrazy skóry przechodzą przez ekstrakcję cech i trzy powiązane sieci, aby uzyskać jedną diagnozę.

Łączenie kilku „opinii” dla ostatecznej decyzji

Zamiast polegać na jednym klasyfikatorze, autorzy wykorzystują trio różnych modeli głębokiego uczenia, z których każdy wnosi inną mocną stronę. Jeden model dobrze uchwytuje uporządkowane relacje w wyekstrahowanych cechach, drugi uczy się warstwowej struktury statystycznej, a trzeci naśladuje aktywność impulsową inspirowaną komórkami mózgu i jest wydajny w obsłudze zmian czasowych i wzorców. System łączy ich wyniki za pomocą reguły ważonej, tak aby każdy model wpływał na ostateczną decyzję proporcjonalnie do swojej skuteczności na danych walidacyjnych. Zespół trenowany i testowany jest na publicznym zbiorze danych z dziewięcioma klasami zmian skórnych, który obejmuje czerniaka i kilka innych powszechnych typów.

Jak dobrze działa system i co wymaga poprawy

W tym zbiorze danych system łącznie poprawnie klasyfikuje około 99% obrazów testowych i osiąga wysoką ocenę w rozdzielaniu typów zmian, przewyższając szereg wcześniejszych podejść głębokiego uczenia. Działa także szybko i zużywa mniej pamięci niż kilka popularnych modeli typu vision transformer, co czyni go bardziej praktycznym w zastosowaniach rzeczywistych. Autorzy zwracają jednak uwagę, że wydajność spada w przypadku rzadkich kategorii zmian, dla których jest mało przykładów, oraz że dane pochodzą z relatywnie podobnych warunków obrazowania i populacji. Ostrzegają, że uogólnienie na różne kliniki, aparaty i odcienie skóry pozostaje otwartym wyzwaniem, a personel medyczny będzie potrzebował jasnych wyjaśnień, zanim zaufa zautomatyzowanym wynikom.

Co to oznacza dla pacjentów i klinicystów

Mówiąc wprost, praca ta pokazuje, że starannie zaprojektowane połączenie oczyszczania obrazu, odkrywania wzorców i wielu modeli głębokiego uczenia może pomóc komputerom rozróżniać wiele typów zmian skórnych z wysoką dokładnością na zbiorze badawczym. Choć takie narzędzia nie zastąpią dermatologów, mogą pewnego dnia służyć jako inteligentny asystent, wskazujący podejrzane ogniska, wspierający drugie opinie i pomagający rozszerzyć poziom ekspertowej diagnostyki na rejony z niewielką liczbą specjalistów. Zanim się to stanie, potrzebne będą większe i bardziej zróżnicowane badania, lepsze radzenie sobie z rzadkimi przypadkami oraz bliższa integracja z praktyką kliniczną.

Cytowanie: Sunkavalli, J.P., Pustokhin, D., Laxmi Lydia, E. et al. Modelling of hybrid deep ensemble learning based skin lesion detection using FCNN denoising and inception-dilated ResNetV2. Sci Rep 16, 15824 (2026). https://doi.org/10.1038/s41598-026-47053-0

Słowa kluczowe: rak skóry, dermoskopia, głębokie uczenie, odszumianie obrazu, modele zespołowe