Clear Sky Science · pl

Wpływ wykorzystania sztucznej inteligencji jako drugiego czytającego w badaniach przesiewowych piersi, włącznie z arbitrażem

· Powrót do spisu

Dlaczego to badanie ma znaczenie dla kobiet i rodzin

Badania przesiewowe piersi są jednym z najpowszechniej stosowanych narzędzi do wykrywania raka we wczesnym stadium, kiedy leczenie jest skuteczniejsze i mniej inwazyjne. System jednak opiera się na dużej, wysoko wykwalifikowanej grupie specjalistów, którzy oglądają obrazy mammograficzne wzrokowo. W Wielkiej Brytanii brakuje radiologów, by swobodnie zaspokoić popyt, co budzi obawy o opóźnienia i przeoczone nowotwory. To badanie zadaje pytanie dotyczące milionów kobiet: czy system sztucznej inteligencji (SI) może bezpiecznie przejąć część pracy czytania obok ekspertów ludzkich bez utraty dokładności — a być może nawet pomóc znaleźć nowotwory wcześniej?

Figure 1
Figure 1.

Jak działają dziś badania przesiewowe piersi

W Programie Badania Piersi w ramach National Health Service kobiety w wieku 50–70 lat są zapraszane na mammografię co trzy lata. Każdy zestaw obrazów jest zwykle oceniany niezależnie przez dwóch przeszkolonych czytających mammografię, takich jak radiolodzy lub specjalistyczne techniki radiograficzne. Jeśli dwójka się nie zgadza, albo gdy wymaga tego lokalna polityka, sprawa trafia do specjalnej dyskusji zwanej arbitrażem, gdzie czytający wspólnie decydują, czy kobieta powinna zostać wezwana na dalsze badania. Ten system podwójnego czytania ma na celu pogodzenie dwóch celów: wykrycia jak największej liczby nowotworów przy jednoczesnym unikaniu niepotrzebnych wezwań, które powodują niepokój, dodatkowe badania i koszty.

Co badacze postanowili przetestować

Zespół przeanalizował mammogramy i dokumentację kliniczną 50 000 kobiet, które były badane w dwóch placówkach szpitalnych w Londynie. Ponieważ te kobiety miały kilka lat obserwacji, badacze mogli zobaczyć nie tylko które nowotwory wykryto przy badaniu przesiewowym, ale też które pojawiły się później między badaniami (tzw. nowotwory międzyokresowe) lub przy następnym rutynowym badaniu. Porównali dwie ścieżki wykorzystując te same historyczne obrazy: standardowe podejście z dwoma ludźmi oraz podejście wspomagane SI, w którym pierwszy czytający był człowiekiem, a drugim systemem SI opracowanym przez Google. Wszelkie przypadki wymagające ostatecznej decyzji trafiały do paneli arbitrażowych złożonych z 22 doświadczonych czytających, którzy pracowali tak, jak w rzeczywistych klinikach.

Jak SI wypadła wobec ekspertów ludzkich

Ogólnie rzecz biorąc, wykorzystanie SI jako drugiego czytającego wypadło co najmniej równie dobrze jak posiadanie dwóch ludzi, po uwzględnieniu decyzji arbitrażu. Ścieżka wspomagana SI wykazała bardzo podobną zdolność do wychwytywania kobiet, które rzeczywiście miały raka (czułość), oraz do uspokajania tych, które go nie miały (swoistość), spełniając rygorystyczne kryteria statystyczne „nie gorszości”. W rzeczywistości swoistość była nieco wyższa przy użyciu SI, co oznacza mniej niepotrzebnych wezwań, a wskaźnik wykrywania nowotworów był praktycznie identyczny w obu podejściach. Ponieważ SI zastąpiła jedno z ludzkich odczytów w większości przypadków, łączna liczba rutynowych odczytów spadła o około połowę, co przekłada się na szacowany spadek czasu pracy czytających o 36–44% nawet po uwzględnieniu dodatkowego wysiłku przy arbitrażu.

Figure 2
Figure 2.

Gdzie SI pomogła — i gdzie zawiodła

Przed arbitrażem system SI częściej niż pojedynczy czytający ludzie sygnalizował nowotwory, które później pojawiły się między badaniami lub przy następnym rutynowym badaniu, co sugeruje, że czasem potrafi wychwycić subtelne zmiany, które ludzie pomijają. Jednak wiele z tych potencjalnych wczesnych ostrzeżeń zostało obalonych podczas arbitrażu, zwłaszcza gdy czytający byli pod wpływem starszych obrazów, których SI nie analizowała, lub przez dodatkowe oznaczenia SI, które okazały się niegroźne. W niewielkiej, lecz istotnej grupie 93 kobiet SI słusznie oceniła, że coś jest nie w porządku, a mimo to panele arbitrażowe zdecydowały o niewezwaniu; większość tych kobiet później rozwinęła nowotwory międzyokresowe lub wykryte przy kolejnym badaniu. Jednocześnie ludzki arbitraż prawidłowo odwołał wiele wezwań wywołanych przez SI u kobiet, które ostatecznie były wolne od nowotworu, poprawiając ogólną swoistość. W różnych grupach wiekowych, wśród różnych grup etnicznych, przy różnych gęstościach gruczołu piersiowego i typach nowotworów, ścieżka wspomagana SI generalnie dorównywała wydajności standardowej opieki, chociaż wyniki dla niektórych mniejszych podgrup były mniej pewne.

Co to może oznaczać dla przyszłych badań przesiewowych

Badanie sugeruje, że SI może bezpiecznie pełnić rolę drugiego czytającego w badaniach przesiewowych piersi bez obniżania jakości opieki, jednocześnie zmniejszając obciążenie przeciążonej kadry. Wskazuje jednak też na ograniczenia obecnych systemów: sama SI pokazała obiecujące możliwości wcześniejszego wykrywania nowotworów, ale te korzyści były rozmywane, gdy ludzie — ze zrozumiałą ostrożnością — nadpisywali niektóre podpowiedzi SI. Autorzy argumentują, że poprawa sposobu, w jaki SI wyjaśnia swoje sugestie, ograniczenie rozpraszających fałszywych alarmów oraz szkolenie klinicystów, kiedy ufać narzędziu, a kiedy je podważać, mogłyby uwolnić większy potencjał tej technologii. Jeśli te partnerstwa człowiek–maszyna zostaną udoskonalone i starannie przetestowane w próbach terenowych, wspomagane SI badania przesiewowe mogą nie tylko utrzymać obecne programy, lecz także pomóc większej liczbie kobiet wykryć raka na etapie, kiedy leczenie ma największe szanse powodzenia.

Cytowanie: Warren, L.M., Venton, J., Young, K.C. et al. Impact of using artificial intelligence as a second reader in breast screening including arbitration. Nat Cancer 7, 507–521 (2026). https://doi.org/10.1038/s43018-026-01128-z

Słowa kluczowe: badania przesiewowe raka piersi, mammografia, sztuczna inteligencja, obciążenie radiologii, arbitraż medyczny