Clear Sky Science · pl

Klasyfikacja wieloklasowa guzów mózgu z wykorzystaniem ResNet101 z modułem wieloskalowej deformowalnej uwagi i zaawansowanymi augmentacjami danych

2026-04-03 · Powrót do spisu

Dlaczego sortowanie skanów mózgu ma znaczenie

Gdy lekarze analizują skany mózgu pod kątem guzów, muszą ustalić nie tylko, czy guz występuje, ale także jaki to typ. Różne typy guzów wymagają odmiennych metod leczenia, a jednocześnie na obrazach rezonansu magnetycznego (MRI) mogą wyglądać bardzo podobnie. W tym badaniu przedstawiono nowe podejście sztucznej inteligencji, które potrafi rozróżnić wiele rodzajów guzów mózgu na podstawie MRI z bardzo wysoką dokładnością, potencjalnie dostarczając radiologom szybsze i bardziej spójne wsparcie przy podejmowaniu decyzji mających wpływ na życie pacjentów.

Figure 1. Jak sztuczna inteligencja przekształca skany MRI mózgu w wyraźne grupy wielu różnych typów guzów.

Nauczanie komputerów „czytania” skanów mózgu

Badacze koncentrują się na klasyfikacji wieloklasowej, czyli rozróżnianiu wielu kategorii guzów jednocześnie, zamiast prostego wykrywania guz / brak guza. Wykorzystują model głębokiego uczenia zbudowany na ResNet101 — szeroko stosowanej sieci do rozpoznawania obrazów, która nauczyła się ogólnych wzorców wizualnych na dużych zbiorach obrazów naturalnych. Zespół adaptuje tę sieć do danych MRI mózgu i stosuje ją na publicznym zbiorze obejmującym 15 klas, od prawidłowej tkanki mózgowej po konkretne guzy, takie jak glejak wielopostaciowy, oponiak i rdzeniak. Zmaganie się z tak wieloma kategoriami sprawia, że zadanie jest bliższe rzeczywistym wyzwaniom, z którymi mierzą się radiolodzy w praktyce klinicznej.

Oczyszczanie i wyrównywanie danych z praktyki

Zbiory obrazów medycznych często zawierają ukryte pułapki, takie jak duplikaty skanów tego samego pacjenta czy duże różnice w częstości występowania poszczególnych typów guzów. Aby uniknąć mylących wyników, autorzy najpierw przeszukują cały zbiór, obliczają cyfrowy odcisk palca dla każdego obrazu i usuwają dokładne duplikaty. Następnie grupują obrazy według ID pacjenta i dzielą pacjentów — a nie obrazy — na zbiory treningowe, walidacyjne i testowe, tak aby skany tej samej osoby nigdy nie pojawiały się w więcej niż jednym podzbiorze. Taki podział po pacjentach pomaga zapewnić, że raportowana dokładność odzwierciedla wydajność na naprawdę nieznanych osobach, a nie na wielokrotnych obrazach tego samego mózgu. Zespół stosuje także zestaw transformacji obrazów i technikę MixUp, aby rzadkie typy guzów były lepiej reprezentowane podczas treningu i żeby model radził sobie z wariacjami orientacji, jasności i szumu.

Figure 2. Jak elastyczna wieloskalowa uwaga pozwala AI skupić się na kluczowych obszarach na MRI mózgu, by rozróżnić typy guzów.

Bliższe spojrzenie dzięki elastycznej uwadze

Kluczową innowacją w badaniu jest moduł nazwany wieloskalowym deformowalnym modułem uwagi. Mówiąc prościej, model analizuje MRI na różnych poziomach szczegółu — od ogólnych struktur całego mózgu po drobniejsze tekstury wokół guza. Zamiast przeszukiwać każde miejsce w sztywnej, siatkowej strukturze, deformowalna uwaga uczy się nieco przesuwać punkty „spojrzenia”, by skupić się na informacyjnych obszarach. Następnie stosuje dwie komplementarne formy uwagi: jedną, która podkreśla ważne miejsca na obrazie, oraz drugą, która wzmacnia najbardziej użyteczne kanały cech w sieci. To połączenie pozwala systemowi lepiej wychwycić subtelne różnice kształtu i tekstury, które rozróżniają poszczególne typy guzów.

Testowanie wydajności i wiarygodności

Po wielu cyklach treningu model osiąga dokładność na zbiorze walidacyjnym na poziomie około 97 procent i dokładność testową powyżej 99 procent we wszystkich 15 klasach. Większość typów guzów jest sklasyfikowana perfekcyjnie w wydzielonym zbiorze testowym, przy jedynie niewielu błędach w kategoriach guzów, które są rzadkie i wizualnie podobne. Badacze porównują swoje wyniki z wcześniejszą metodą również wykorzystującą deformowalną uwagę i pokazują, że ich podejście dorównuje lub przewyższa ją w niemal wszystkich miarach ewaluacyjnych, mimo złożonego rozkładu klas. Poddają system dodatkowym testom, dodając szum i zmniejszając rozdzielczość obrazów, i stwierdzają, że dokładność pozostaje wysoka nawet przy pogarszającej się jakości skanów — co jest istotne w warunkach szpitalnych.

Pokazywanie, na co patrzy model

Aby zwiększyć zaufanie klinicystów do systemu, autorzy stosują narzędzia wizualizacyjne, które ujawniają, na czym sieć się skupia przy podejmowaniu decyzji. Mapy cieplne generowane przez Grad-CAM uwidaczniają obszary na MRI, które najbardziej wpłynęły na predykcję, a analizy oparte na SHAP wskazują, które wyuczone cechy przesuwają model w kierunku jednej diagnozy lub drugiej. Te wizualne wyjaśnienia konsekwentnie wskazują na regiony guza i ich granice, a nie na nieistotne tło, sugerując, że rozumowanie modelu zgadza się z intuicją radiologiczną. Choć badanie podkreśla konieczność dalszych testów zewnętrznych, pokazuje, że starannie zaprojektowany pipeline głębokiego uczenia może nie tylko klasyfikować wiele typów guzów mózgu z dużą niezawodnością, lecz także dostarczać interpretowalnych wskazówek dotyczących podejmowanych decyzji.

Co to może znaczyć dla pacjentów

W codziennej praktyce klinicznej taki system nie zastąpi radiologów, lecz będzie działać jako drugi czytelnik, szybko wskazując prawdopodobne typy guzów i zwracając uwagę na podejrzane obszary na skanie. Dzięki obsłudze szerokiego spektrum guzów i stabilności przy zaszumionych lub niższej jakości obrazach, opisane ramy pokazują, jak AI mogłaby wspierać bardziej spójne i terminowe rozpoznania. Przy dodatkowej walidacji w różnych szpitalach i na różnych skanerach takie narzędzia mogłyby stać się częścią rutynowych procesów, pomagając specjalistom skupić się na planowaniu leczenia, podczas gdy komputery przejmą dużą część powtarzalnego sortowania obrazów.

Cytowanie: Reddy, B.S., Jha, R.R., Dasore, A. et al. Multi-class classification of brain tumor using a ResNet101 backbone integrated with multi-scale deformable attention module and advanced data augmentations. Sci Rep 16, 15938 (2026). https://doi.org/10.1038/s41598-026-45675-y

Słowa kluczowe: MRI guza mózgu, głębokie uczenie, AI w obrazowaniu medycznym, klasyfikacja guzów, sieci uwagowe