Clear Sky Science · pl

Przyrostowe uczenie do semantycznej segmentacji obrazów histologicznych skóry

· Powrót do spisu

Dlaczego nauczenie komputerów „czytania” próbek skóry ma znaczenie

Rak skóry jest jednym z najczęstszych nowotworów na świecie, a lekarze często polegają na cienkich przekrojach tkankowych oglądanych pod mikroskopem, aby ocenić, jak poważny jest guz i jak go leczyć. Odczytywanie tych preparatów jest pracą czasochłonną i wymagającą, a wyniki mogą się różnić w zależności od specjalisty. W badaniu tym zbadano, jak zbudować systemy komputerowe, które uczą się rozpoznawać różne tkanki i nowotwory skóry na obrazach mikroskopowych, a co ważniejsze — jak umożliwić im ciągłe doskonalenie w miarę dodawania nowych typów obrazów, podobnie jak praktykant, który uczy się przez całą karierę.

Figure 1
Figure 1.

Od prostych odpowiedzi tak/nie do szczegółowych map tkanek

Wiele istniejących narzędzi sztucznej inteligencji dla diagnostyki raka skóry odpowiada na wąskie pytanie, na przykład „rak” lub „brak raka”. Choć przydatne, takie decyzje tak/nie nie oddają bogactwa szczegółów widocznych dla patologów. W praktyce lekarzy interesuje wiele struktur jednocześnie: różne typy nowotworów, warstwy zdrowej skóry, mieszki włosowe, gruczoły, obszary zapalne i inne. W tym badaniu skupiono się na „semantycznej segmentacji”, gdzie każdy piksel obrazu histologicznego przypisany jest do jednej z dwunastu kategorii tkankowych. Powstaje w ten sposób kolorowa mapa pokazująca dokładne położenie różnych nowotworów i tkanek prawidłowych, co daje jaśniejsze wskazówki przy diagnozie i planowaniu leczenia.

Dlaczego obecne systemy mają problem z adaptacją

Współczesne, wydajne modele głębokiego uczenia zwykle zakładają, że wszystkie dane treningowe są dostępne jednocześnie. Po wytrenowaniu ich „wiedza” często zostaje zamrożona. Jeśli później pojawią się nowe dane o innych właściwościach — na przykład obrazy w innej powiększeniu — najbezpieczniejszą opcją bywa ponowne wytrenowanie całego modelu od zera. To jest kosztowne i czasochłonne, a co gorsza, dodanie nowych informacji może wywołać efekt „katastrofalnego zapominania”, gdy wydajność na wcześniejszych zadaniach cicho się pogarsza. W środowisku klinicznym dane zmieniają się jednak nieustannie: skanery są modernizowane, ustawienia obrazowania się zmieniają, a szpitale gromadzą nowe rodzaje próbek. Narzędzie AI, które nie potrafi płynnie wchłaniać takich zmian, jest trudne do zaufania w codziennej praktyce.

Krokowa strategia uczenia inspirowana tym, jak uczą się ludzie

Autorzy opracowali system oparty na nowoczesnej architekturze vision transformer zwanej SegFormer i przekształcili ją w system „uczenia przyrostowego” dla nowotworów skóry innych niż czerniak. Zamiast przetwarzać wszystkie dane na raz, model trenowany jest etapami przy użyciu preparatów histologicznych z publicznego zbioru Uniwersytetu Queensland. Najpierw uczy się na obrazach o dużym powiększeniu (10×), gdzie widoczne są drobne szczegóły. Później dodawane są obrazy w powiększeniach 5×, a następnie 2×, przy czym część wcześniej użytych danych o wysokiej rozdzielczości pozostaje w zestawie. Specjalne funkcje kosztu pomagają nowej wersji modelu zachować to, co już wiedział o wzorcach tkankowych, nawet gdy dostosowuje się do bardziej oddalonych, mniej szczegółowych widoków. To „uczenie się bez zapominania” jest wspierane techniką zwaną destylacją wiedzy, gdzie wcześniejszy model działa jako nauczyciel dla nowego, oraz przez wzajemny składnik destylacji, który skłania zarówno stare, jak i nowe reprezentacje do pozostania w zgodzie.

Figure 2
Figure 2.

Uczenie się przez różne poziomy powiększenia i rzadkie typy tkanek

Obrazy histologiczne są trudne nie tylko ze względu na dużą liczbę typów tkanek, ale także dlatego, że niektóre istotne struktury występują rzadko. Zbiór danych obejmuje powszechne nowotwory, takie jak rak podstawnokomórkowy i płaskonabłonkowy, a także warstwy skóry prawidłowej i zapalonej — każda adnotowana na poziomie piksela przez ekspertów, co jest żmudnym procesem trwającym setki godzin. Autorzy dzielą te ogromne preparaty na małe fragmenty i trenują model, stosując ostrożny podział na zbiory treningowe, walidacyjne i testowe, zachowując proporcje klas tkankowych na każdym poziomie powiększenia. Aby pomóc systemowi rozpoznawać rzadkie, ale klinicznie istotne obszary, wzmacniają niedostatecznie reprezentowane klasy poprzez obracanie fragmentów i eksponowanie modelu na te tkanki na różnych poziomach powiększenia. Ta wieloresolucyjna ekspozycja pomaga SI rozpoznać tę samą strukturę biologiczną, niezależnie od tego, czy pojawia się jako wyraźne zbliżenie, czy jako łagodniejszy, bardziej ogólny kształt.

Co model osiąga w porównaniu z wcześniejszymi narzędziami

Samo w sobie modele SegFormer trenowane oddzielnie dla każdego powiększenia już przewyższają wcześniejsze projekty konwolucyjne, takie jak U-Net, w wielu kategoriach tkankowych. Jednak gdy zastosowano schemat uczenia przyrostowego — najpierw trening przy 10×, potem przy 10× i 5×, a wreszcie przy 10×, 5× i 2× łącznie — zyski stają się wyraźne. Dokładność ogólna wzrasta z około 89% przy użyciu tylko obrazów 10× do ponad 95% po uwzględnieniu wszystkich trzech powiększeń. Miary nakładania się przewidywanych i rzeczywistych regionów również systematycznie się poprawiają, a wydajność na nowotworach takich jak rak podstawnokomórkowy i płaskonabłonkowy oraz kluczowych warstwach prawidłowych, jak naskórek i brodawkowa warstwa skóry właściwej, przewyższa metody konkurencyjne. Co istotne, w miarę dodawania każdego nowego poziomu powiększenia model nie zapomina tego, czego się wcześniej nauczył; zamiast tego jego rozumienie struktury tkankowej staje się bardziej odporne i uogólnione.

Jak ta praca przybliża diagnostykę wspomaganą przez AI do praktyki klinicznej

Dla osób niebędących specjalistami główne przesłanie jest takie, że autorzy stworzyli „mapownika” tkanek skóry, który potrafi nadal badać nowe rodzaje obrazów bez utraty wcześniejszych umiejętności. Poprzez staranne zaprojektowanie etapów uczenia modelu i ponownego wykorzystywania jego wcześniejszej wiedzy, pokazują, że możliwe jest zbudowanie narzędzi AI, które adaptują się w miarę ewolucji praktyk obrazowania medycznego. Choć potrzebna jest dalsza walidacja w różnych szpitalach i przy innych typach chorób, ten przyrostowy, oparty na transformerach podejście wskazuje drogę do systemów AI, które mogą pozostać aktualne wobec zmieniających się danych, dostarczać szczegółowe wizualne wyjaśnienia położenia nowotworów i ostatecznie wspierać patologów w podejmowaniu pewniejszych i bardziej spójnych decyzji terapeutycznych.

Cytowanie: Fatima, S., Salam, A.A., Akram, M.U. et al. Incremental learning approach for semantic segmentation of skin histology images. Sci Rep 16, 9593 (2026). https://doi.org/10.1038/s41598-025-31553-6

Słowa kluczowe: rak skóry, obrazy histologiczne, semantyczna segmentacja, uczenie przyrostowe, głębokie uczenie, transformatory