Clear Sky Science · pl

Udoskonalony Swin Transformer z podwójną uwagą do oceny zaawansowania choroby zwyrodnieniowej kolana na zdjęciach rentgenowskich

2026-03-30 · Powrót do spisu

Dlaczego bolące kolana mają znaczenie

Ból kolana to coś więcej niż tylko kłopot; jest jedną z głównych przyczyn niepełnosprawności na świecie, szczególnie wraz z wiekiem. Lekarze w dużym stopniu polegają na zdjęciach rentgenowskich, aby ocenić, czy choroba zwyrodnieniowa kolana jest łagodna i możliwa do opanowania, czy też na tyle zaawansowana, by rozważyć zabieg chirurgiczny. Jednak analiza tych obrazów zajmuje czas, może nie wykryć wczesnych uszkodzeń, a eksperci nie zawsze się zgadzają. W tym badaniu przedstawiono nowy system sztucznej inteligencji (AI), który ma na celu szybko i bardzo dokładnie odczytywać zdjęcia rentgenowskie kolan, pomagając klinicystom wykrywać uszkodzenia stawu wcześniej i prowadzić leczenie w bardziej spójny sposób.

Inteligentniejszy sposób odczytu zdjęć rentgenowskich kolan

Choroba zwyrodnieniowa stopniowo zużywa gładką chrząstkę amortyzującą kolano, powodując ból, sztywność i utratę ruchomości. Na zdjęciu rentgenowskim lekarze szukają oznak takich jak zwężenie przestrzeni między kośćmi czy małe narośla kostne zwane osteofitami. Zmiany te są podsumowywane pięciostopniową skalą znaną jako skala Kellgrena–Lawrence’a (KL), od 0 (zdrowe) do 4 (ciężkie). Tradycyjne programy komputerowe oparte na splotowych sieciach neuronowych (CNN) pomogły zautomatyzować tę ocenę, ale mają trudności z wychwyceniem subtelnych wzorców w całym obrazie i często wymagają dużej mocy obliczeniowej oraz długiego czasu szkolenia. Autorzy tej pracy postawili sobie za cel zaprojektowanie systemu, który nie tylko byłby bardziej dokładny, lecz także lżejszy i szybszy, aby mógł być realistycznie stosowany w zatłoczonych poradniach, także w placówkach o ograniczonych zasobach.

Jak działa nowy system AI

Naukowcy stworzyli hybrydowy model nazwany Swin‑O‑NETS, łączący dwie koncepcje: zaawansowany czytnik obrazów znany jako Swin Transformer oraz szybki, lekki klasyfikator zwany Fast Extreme Learning Network. Najpierw zdjęcia rentgenowskie z dużej publicznej bazy danych — Osteoarthritis Initiative — są oczyszczane i ulepszane w celu usunięcia szumów i poprawy kontrastu. Następnie obrazy dzielone są na małe fragmenty i przechodzą przez sieć w kształcie litery U, która segmentuje i analizuje obszar kolana. Wewnątrz tej sieci zmodyfikowany Swin Transformer analizuje obraz na wielu skalach, od drobnych szczegółów na powierzchni stawu po szersze wzorce strukturalne obejmujące całe kolano.

Zwracanie uwagi na właściwe szczegóły

Kluczową innowacją jest zastosowanie wielogłowicowej samouważności kanałowej, mechanizmu pomagającego AI zdecydować, które cechy obrazu są najważniejsze. Zamiast traktować wszystkie części zdjęcia rentgenowskiego jednakowo, model uczy się skupiać na kanałach niosących informacje o zwężeniu przestrzeni stawowej, krawędziach kości i wczesnych naroślach kostnych, jednocześnie zmniejszając wagę mniej informatywnych obszarów tła. Wiele „głów” uwagi analizuje dane równolegle, a ich wyniki są następnie łączone, wzbogacając ogólny opis kolana. Te udoskonalone cechy trafiają do Fast Extreme Learning Network, który wykonuje końcowy krok — przypisanie zdjęcia rentgenowskiego do jednej z pięciu klas KL. Ponieważ ten klasyfikator potrafi obliczyć swoje wewnętrzne wagi w pojedynczym kroku matematycznym zamiast przez wiele powolnych cykli szkoleniowych, cały system pozostaje efektywny mimo swojej zaawansowanej konstrukcji.

Testy systemu

Aby sprawdzić wydajność Swin‑O‑NETS, autorzy trenowali i testowali go na 2 047 oznakowanych zdjęciach rentgenowskich kolan, starannie wyrównując reprezentację różnych stopni zaawansowania i stosując techniki augmentacji danych, takie jak obrót i skalowanie, aby uniknąć przeuczenia. Porównali swój model z popularnymi architekturami uczenia głębokiego, w tym standardowymi CNN, VGG‑19, ResNet, DenseNet oraz kilkoma wariantami zespołowymi i wzbogaconymi o mechanizmy uwagi. We wszystkich pięciu klasach KL — od zdrowych do silnie uszkodzonych — Swin‑O‑NETS systematycznie osiągał najwyższe wyniki. Uzyskał około 99,5% dokładności ogólnej, przy równie wysokiej precyzji, czułości i miarach F1 oraz polu pod krzywą ROC równym 0,9838, co wskazuje na doskonałą zdolność rozróżniania poziomów zaawansowania. Jednocześnie wymagał mniej obliczeń i krótszego czasu szkolenia niż wiele konkurencyjnych modeli opartych na transformerach.

Co to może znaczyć dla pacjentów

Mówiąc prosto, praca ta pokazuje, że starannie zaprojektowany system AI może niemal perfekcyjnie oceniać zaawansowanie choroby zwyrodnieniowej kolana na zdjęciach rentgenowskich, pozostając przy tym praktycznym w użyciu. Dzięki wykrywaniu wczesnych zmian w stawie, które mogą umknąć ludzkiemu oku, oraz robieniu tego szybko i spójnie, Swin‑O‑NETS mógłby wspierać wcześniejsze interwencje związane ze stylem życia lub leczeniem medycznym, opóźniać konieczność wymiany stawu i pomagać standaryzować opiekę w różnych szpitalach. Autorzy zauważają, że wdrożenie w rzeczywistych warunkach będzie wymagać dalszych testów na większych, wieloośrodkowych zbiorach danych oraz opracowania jeszcze lżejszych wersji nadających się do pracy w czasie rzeczywistym. Mimo to ich wyniki sugerują, że inteligentne czytniki obrazów tego typu mogą wkrótce stać się rutynowym wsparciem dla radiologów, dyskretnie poprawiając perspektywy milionów osób żyjących z bolącymi, osłabionymi kolanami.

Cytowanie: Sudha, K., Rajiv Kannan, A. Enhanced swin transformer with dual attention for knee osteoarthritis severity grading from X-ray images. Sci Rep 16, 10617 (2026). https://doi.org/10.1038/s41598-026-44174-4

Słowa kluczowe: choroba zwyrodnieniowa stawu kolanowego, obrazowanie rentgenowskie, uczenie głębokie, sieci transformerowe, klasyfikacja obrazów medycznych