Clear Sky Science · pl

Porównanie wydajności sztucznej inteligencji i pracowników ochrony zdrowia w analizie wideo chirurgicznego i zabiegowego: przegląd systematyczny i metaanaliza

2026-03-06 · Powrót do spisu

Mądrzejsze oczy na sali operacyjnej

Co roku setki milionów osób przechodzą zabiegi i procedury małoinwazyjne prowadzone przy użyciu obrazu wideo — pomyśl o kolonoskopii, operacji „na klucz” czy malutkich kamerach wprowadzanych do naczyń krwionośnych. W takich chwilach zdolność lekarza do dostrzeżenia subtelnych sygnałów na ekranie może decydować o wykryciu raka we wczesnym stadium lub o jego przeoczeniu. W tym badaniu postawiono pytanie istotne z perspektywy każdego pacjenta: jak dobrze systemy sztucznej inteligencji radzą sobie z analizą materiałów wideo z zabiegów i operacji w porównaniu z klinicystami, i co się dzieje, gdy obie strony współpracują?

Porządkowanie zalewu wideo chirurgicznych

Współczesna medycyna rejestruje ogromne ilości nagrań z procedur — od endoskopii przewodu pokarmowego po operacje wspomagane robotycznie. Te nagrania kryją w sobie wiele informacji: drobne polipy w jelicie, wczesne guzy w żołądku czy przełyku, delikatne nerwy, których trzeba unikać, czy kolejne etapy skomplikowanej operacji. Naukowcy uczą systemy SI przeszukiwania tych obrazów, oznaczania podejrzanych obszarów, a nawet rozpoznawania, na jakim etapie procedury znajduje się chirurg. Jednak dotąd większość badań stawiała SI w sztucznych pojedynkach z lekarzami, zamiast pytać, jak technologia mogłaby być wykorzystana w realistyczny sposób — jako pomoc przy boku klinicysty. Niniejszy przegląd miał na celu systematyczne zebranie i przeanalizowanie tych rozproszonych dowodów w różnych specjalnościach.

Co zbadali autorzy

Zespół przeszukał główne bazy medyczne i inżynieryjne, zaczynając od niemal 38 000 artykułów. Po zastosowaniu rygorystycznych kryteriów — wyłącznie badania pierwotne, które stosowały SI do analizy rzeczywistych materiałów wideo z zabiegów i bezpośrednio porównywały jej wydajność z wynikami pracowników ochrony zdrowia — pozostało tylko 146 badań. Obejmowały one szerokie spektrum procedur, zwłaszcza endoskopię przewodu pokarmowego, ale także interwencje pulmonologiczne, tarczycowe, neurochirurgiczne, kardiologiczne i urologiczne. Większość korzystała z nowoczesnych metod uczenia głębokiego, takich jak splotowe sieci neuronowe, szkolonych do wykrywania chorób, rozpoznawania anatomii, oceny czystości jelita czy identyfikacji etapów operacji. W 76 pracach podano wystarczająco szczegółowe dane, by autorzy mogli złączyć wyniki i obliczyć, jak często SI i ludzie mieli rację lub popełniali błędy.

SI samodzielnie kontra lekarze oraz SI jako współpracownik

Gdy badacze porównali SI z nie wspomaganymi klinicystami oglądającymi te same nagrania, systemy SI zwykle wykrywały więcej prawdziwych problemów (wyższa czułość) bez wywoływania większej liczby fałszywych alarmów (porównywalna swoistość). Wzorzec ten utrzymywał się zarówno przy testach na danych znanych modelom, jak i przy zewnętrznych, nowych zbiorach danych. Najbardziej klinicznie istotne wnioski pojawiły się jednak, gdy SI była używana jako asystent. W szerokim zakresie zadań klinicyści, którzy widzieli sugestie SI, byli lepsi w wykrywaniu choroby i rzadziej błędnie klasyfikowali tkanki normalne niż osoby pracujące samodzielnie. Zwiększenie skuteczności było szczególnie wyraźne w przypadku mniej doświadczonych użytkowników, takich jak rezydenci, którzy najwięcej zyskiwali dzięki wskazówkom SI. U doświadczonych specjalistów poziom osiągnięty przy wsparciu SI był zbliżony do wyników SI działającej samodzielnie, co sugeruje, że w rękach ekspertów kombinacja człowiek–maszyna może dorównać najlepszym samodzielnym algorytmom.

Rozbieżności między warunkami laboratoryjnymi a rzeczywistością

Mimo obiecujących wyników przegląd podkreśla przepaść między sposobem, w jaki obecnie testuje się SI, a tym, jak musi ona działać w rzeczywistych warunkach klinicznych. Wiele badań oczyszczało dane, usuwając rozmyte lub niskiej jakości klatki wideo, podczas gdy sale operacyjne i pracownie endoskopowe często mają do czynienia właśnie z takimi niedoskonałościami. Inne analizowały izolowane migawki zamiast ciągłego wideo, omijając wyzwanie śledzenia ruchu i synchronizacji czasowej. Niewiele badań oceniało SI w czasie rzeczywistym przy łóżku pacjenta, a większość opierała się na sprzęcie wysokiej klasy, który może nie być dostępny w placówkach o ograniczonych zasobach. Praktyki raportowania były również niespójne: kluczowe szczegóły dotyczące strojenia i walidacji modeli często brakowały, co utrudnia innym zespołom reprodukcję lub rzetelną ocenę wyników.

Budowanie godnych zaufania partnerstw człowiek–SI

Autorzy argumentują, że SI w chirurgii i medycynie zabiegowej powinna być rozwijana i testowana od początku jako partner dla klinicystów, a nie ich zastępstwo. To oznacza projektowanie badań odzwierciedlających warunki rzeczywiste, dzielenie się zróżnicowanymi zbiorami wideo między ośrodkami oraz przyjęcie jasnych standardów raportowania, aby inne zespoły mogły weryfikować i ulepszać opublikowane prace. Obejmuje to także szkolenie klinicystów w rozumieniu mocnych stron i uprzedzeń SI, zamiast ślepego ufania lub odrzucania jej sugestii. Chociaż metaanaliza pokazuje, że SI już teraz może dorównać lub przewyższyć wyniki nie wspomaganych ludzi w wielu zadaniach opartych na wideo, najbardziej znaczące korzyści wynikają z tego, jak może ona wyostrzyć ludzkie osądy. Dla pacjentów wniosek nie jest taki, że maszyny przejmą salę operacyjną, lecz że starannie zaprojektowane zespoły człowiek–SI mogą uczynić procedury bezpieczniejszymi, diagnozy wcześniejszymi, a wyniki lepszymi.

Cytowanie: Rafati Fard, A., Williams, S.C., Smith, K.J. et al. Comparing artificial intelligence and healthcare professional performance in surgical and interventional video analysis: a systematic review and meta-analysis. npj Digit. Med. 9, 323 (2026). https://doi.org/10.1038/s41746-026-02401-2

Słowa kluczowe: Sztuczna inteligencja w wideo chirurgicznym, komputerowo wspomagana endoskopia, współpraca człowiek–SI, analiza obrazów medycznych, wsparcie decyzji klinicznych