Clear Sky Science · pl

Dwufazowe podejście do wstępnego przetwarzania i klasyfikacji dla dokładnego wykrywania COVID-19 na zdjęciach rentgenowskich

2026-03-14 · Powrót do spisu

Dlaczego inteligentniejsze czytanie zdjęć rentgenowskich ma znaczenie

Podczas pandemii COVID-19 lekarze opierali się głównie na testach laboratoryjnych, aby potwierdzić zakażenie. Jednak sprzęt laboratoryjny bywa deficytowy, a wyniki mogą się długo opóźniać — zwłaszcza w miejscach o ograniczonych zasobach. Zdjęcia rentgenowskie klatki piersiowej są natomiast szybkie i powszechnie dostępne, choć nawet doświadczeni radiolodzy mają trudności ze wykryciem często subtelnych zmian w płucach wywołanych przez COVID-19. Artykuł opisuje sposób nauczania komputerów bardziej wiarygodnego odczytywania zdjęć rentgenowskich poprzez najpierw oczyszczenie obrazów, a następnie zastosowanie nowoczesnej sztucznej inteligencji, z celem wspierania klinicystów w szybkim i dokładnym podejmowaniu decyzji.

Dostrzeganie istotnych szczegółów w zaszumionych obrazach

Zdjęcie rentgenowskie klatki piersiowej zawiera mieszankę informacji: kości, tkanki miękkie, cienie i artefakty maszynowe nakładają się na siebie. Standardowe systemy głębokiego uczenia próbują uczyć się bezpośrednio z surowych obrazów, co oznacza, że sieć musi sama rozpoznać, które fragmenty obrazu są istotne. To trudne, gdy obrazy różnią się jasnością, kontrastem i jakością. Autorzy rozwiązują to przez dodanie dedykowanego etapu wstępnego przetwarzania przed podaniem obrazów do sieci neuronowej. Wykorzystują technikę wizji komputerowej zwaną Maksymalnie Stabilnymi Regionami Ekstremalnymi (MSER), która skanuje obraz na wielu poziomach jasności i wybiera obszary, które pozostają stabilne przy zmianie progu. Te stabilne fragmenty często odpowiadają znaczącym strukturom — na przykład obszarom nieprawidłowej tkanki płucnej — podczas gdy ignorują bardziej losowe zakłócenia.

Pozwolić wirtualnemu stadu wilków dobrać parametry

MSER jest potężny, ale wybredny: jego działanie zależy w dużym stopniu od kilku parametrów numerycznych, które kontrolują, jak duży może być region, jak bardzo jego jasność może się zmieniać i jak gładkie mają być jego krawędzie. Ręczne testowanie wszystkich kombinacji dla tysięcy zdjęć byłoby żmudne i wolne. Aby to rozwiązać, badacze sięgają po inspirowaną naturą metodę optymalizacji zwaną Optymalizatorem Szarych Wilków. W tym algorytmie wirtualne stado „wilków” eksploruje różne kombinacje parametrów, stopniowo przesuwając się ku tym, które dają najczystsze i najbardziej informatywne regiony na obrazach. Jakość każdego ustawienia ocenia się miernikiem, który nagradza regiony jednorodne wewnętrznie i wyraźnie odseparowane od otoczenia. W ciągu kilkudziesięciu iteracji na obraz stado zbiega do zestawu parametrów, które uwypuklają podejrzane obszary płuc.

Nauczanie sieci neuronowych na oczyszczonych obrazach

Gdy zdjęcia rentgenowskie zostaną w ten sposób doprecyzowane, trafiają do konwolucyjnej sieci neuronowej — tej samej klasy modeli szeroko używanych do rozpoznawania twarzy czy samochodów autonomicznych. Autorzy przetestowali swoją dwufazową metodę z trzema rodzinami sieci: bardzo prostą siecią autorską, DenseNet (silniejsza i bardziej złożona architektura) oraz MobileNet (lżejszy model przeznaczony dla urządzeń mobilnych). Dla każdej z nich porównali wyniki na dwóch publicznych zbiorach zdjęć klatki piersiowej, najpierw używając surowych obrazów, a następnie obrazów przetworzonych przez kombinację MSER–Optymalizatora Szarych Wilków. W każdym przypadku obrazy po wstępnym przetworzeniu dały wyższą dokładność, mniej fałszywych alarmów i szybsze uczenie. W jednym przypadku dokładność wzrosła z około 90% do niemal 99%, a czas treningu skrócił się mniej więcej o dwie trzecie.

Jak odporne jest to podejście w rzeczywistych warunkach?

Aby sprawdzić, czy metoda nie nauczyła się jedynie osobliwości jednego zbioru danych, autorzy przeprowadzili trudniejszy test: trenowali modele na jednej kolekcji zdjęć, a następnie oceniali je na innej, której nigdy wcześniej nie widziały. Wyniki naturalnie spadły, ale systemy korzystające z nowego etapu wstępnego przetwarzania radziły sobie znacznie lepiej niż te trenowane wyłącznie na surowych obrazach. Badanie zawierało też analizę ablation, która wykazała, że użycie MSER bez automatycznego dostrajania niewiele pomagało, oraz porównanie z bardziej konwencjonalną metodą zwiększania kontrastu. W tych przypadkach korzyści w dużej mierze znikały. To sugeruje, że kluczowym składnikiem nie jest samo „uwydatnianie” obrazów, lecz ukierunkowanie algorytmu na izolowanie stabilnych, istotnych dla choroby regionów w sposób zasadniczy i oparty na danych.

Co to oznacza dla pacjentów i lekarzy

Praca nie zastępuje testów PCR ani ekspertów radiologii, a autorzy wskazują na ograniczenia: dane pochodzą z ograniczonego zestawu szpitali i nie przetestowali metody na każdej nowoczesnej architekturze sieci ani w odniesieniu do innych chorób płuc. Mimo to wyniki pokazują, że przemyślane wstępne przetwarzanie może znacząco zwiększyć dokładność i wydajność istniejących systemów SI. Pomagając sieciom neuronowym skupić się na najbardziej informatywnych fragmentach każdego zdjęcia klatki piersiowej, podejście dwufazowe oferuje praktyczną ścieżkę do niezawodnych, zautomatyzowanych narzędzi wspierających diagnozowanie COVID-19 i potencjalnie innych chorób układu oddechowego — zwłaszcza w środowiskach, gdzie szybkie decyzje i ograniczone zasoby obliczeniowe są codziennością.

Cytowanie: González, A., Gutiérrez, V.G., Cuevas, E. et al. A two-stage preprocessing and classification approach for accurate COVID-19 detection in X-ray images. Sci Rep 16, 13514 (2026). https://doi.org/10.1038/s41598-026-41861-0

Słowa kluczowe: Diagnoza COVID-19 na zdjęciach rentgenowskich, wstępne przetwarzanie obrazów medycznych, uczenie głębokie w radiologii, systemy wspomagające wykrywanie, SZP (sztuczna inteligencja) w obrazowaniu klatki piersiowej