Clear Sky Science · pl

Skuteczność algorytmów przewidywania ryzyka raka piersi w zależności od systemu mammograficznego w brytyjskim programie przesiewowym

· Powrót do spisu

Dlaczego to ma znaczenie dla kobiet i rodzin

Badania przesiewowe piersi ratują życie, wykrywając nowotwory we wczesnym stadium, ale wiele guzów pojawia się w latach między rutynowymi mammografiami, często w bardziej zaawansowanym stadium. W tym badaniu postawiono proste, lecz istotne pytanie: czy sztuczna inteligencja (AI) potrafi przeanalizować „prawidłową” mammografię i dyskretnie wskazać kobiety będące w rzeczywistości w wysokim krótkoterminowym ryzyku, aby można im było zaoferować dodatkowe badania zanim nowotwór urośnie i da przerzuty?

Figure 1
Figure 1.

Dostrzeganie więcej na „normalnej” mammografii

Większość krajowych programów przesiewowych, w tym brytyjski, zaprasza kobiety na mammografię co trzy lata. Jeśli nie wykryje się nic podejrzanego, wynik uznaje się za „negatywny” i kobieta wraca do codziennego życia. Tymczasem około 30% raków piersi u kobiet objętych przesiewem to tzw. raki intervalowe, które ujawniają się między zaplanowanymi wizytami i zwykle mają gorsze rokowanie. Ostatnio zaawansowane systemy AI nauczyły się analizować mammogramy wyglądające na prawidłowe dla ludzkich czytelników i przydzielać każdej kobiecie krótkoterminowy wynik ryzyka. Idea polega na wykorzystaniu tych ukrytych informacji do indywidualizacji częstości badań oraz wskazania, komu zaoferować bardziej czułe testy, takie jak rezonans magnetyczny czy mammografia z kontrastem.

Test czterech narzędzi AI

Naukowcy przeanalizowali 112 621 negatywnych mammogramów przesiewowych z dwóch ośrodków NHS Breast Screening Programme w Anglii, obejmujących pełną, trzyletnią rundę od 2014 do 2017 roku i śledząc kobiety przez pięć lat. Oba ośrodki używały różnych cyfrowych aparatów mammograficznych (Philips i GE), co odzwierciedla zróżnicowanie występujące w rzeczywistości. W trakcie obserwacji u 1 225 kobiet rozpoznano raka piersi, w tym 396 raków intervalowych oraz dodatkowe nowotwory wykryte przy następnym badaniu przesiewowym. Cztery wiodące algorytmy ryzyka AI — trzy komercyjne i jeden model akademicki — uruchomiono lokalnie na każdym mammogramie w celu wygenerowania wyniku ryzyka wystąpienia nowotworu, a następnie porównano ich skuteczność.

Jak dobrze algorytmy wykrywały przyszłe nowotwory

Wszystkie cztery systemy AI potrafiły odróżnić z lepszą niż losowa trafnością kobiety, które rozwinęły raka, od tych, które nie zachorowały, lecz ich wyniki były zróżnicowane. Jeden algorytm (oznaczony jako DL-1) konsekwentnie wykazywał najsilniejszą wydajność, podczas gdy inny (DL-3) wypadł słabiej. Gdy zespół skupił się na rakach intervalowych — tych pojawiających się wkrótce po „prawidłowym” skanie — najlepszy model osiągnął poziom dokładności porównywalny lub lepszy od wcześniejszych badań opartych na pojedynczych algorytmach. Co istotne, trzy z czterech narzędzi działały podobnie na obrazach z aparatów Philips i GE, co sugeruje, że potrafią poradzić sobie z pewnymi różnicami sprzętowymi, chociaż jeden algorytm wyraźnie gorzej radził sobie na jednym z systemów.

Co się stanie, jeśli zareagujemy na najwyższe wyniki ryzyka?

Pytanie praktyczne dla służb przesiewowych brzmi: ile kobiet przywoływać na dodatkowe badania na podstawie wyników AI. Badacze przeanalizowali więc klinicznie istotne progi. Jeśli na dodatkową uwagę wybrać jedynie 4% kobiet o najwyższym ryzyku (według wyników każdego narzędzia), dwa najlepsze algorytmy łącznie wychwyciły około jednej na pięć wszystkich przyszłych zachorowań i ponad jedną czwartą raków intervalowych. Po złagodzeniu progu do 14% najwyższych wyników ryzyka — bliżej wskaźników przywołań obserwowanych w niektórych programach północnoamerykańskich — uzysk zwiększył się mniej więcej dwukrotnie: najsilniejszy model zidentyfikował około 42% wszystkich przyszłych raków i połowę raków intervalowych. Jednak każde narzędzie miało tendencję do wskazywania częściowo odmiennego podzbioru przypadków, z relatywnie niewielkim nakładaniem się, co sugeruje, że strategie zespołowe lub wykorzystanie wielu narzędzi mogłyby wykryć więcej guzów niż pojedynczy model.

Figure 2
Figure 2.

Mocne strony, luki i kolejne kroki

To badanie wyróżnia się zastosowaniem kompletnych, rutynowych danych z dwóch dużych ośrodków NHS zamiast wąsko wyselekcjonowanej próbki badawczej oraz jest pierwszym, które ocenia kilka nazwanych narzędzi AI do oceny ryzyka obok siebie w warunkach brytyjskich. Jednocześnie istnieją ograniczenia. Wyłączono kobiety z implantami lub niestandardowymi projekcjami obrazów, a badanie objęło tylko dwie marki mammografów, więc skuteczność na innych urządzeniach lub w różnych grupach etnicznych pozostaje niepewna. Ponieważ analiza miała charakter retrospektywny, niektóre nowotwory, które mogłyby zostać wykryte wcześniej dzięki dodatkowym badaniom opartym na ryzyku, nie zostały policzone, co oznacza, że rzeczywisty zysk mógłby być większy niż przedstawiony.

Co to oznacza dla przyszłości badań przesiewowych piersi

Dla czytelnika popularnonaukowego konkluzja jest taka, że nowoczesne systemy AI potrafią wykrywać sygnały w „prawidłowych” mammografiach, które przewidują, które kobiety w najbliższym czasie są bardziej narażone na rozwój raka piersi, szczególnie na raki intervalowe, które trudno wcześnie wychwycić. Najlepsze algorytmy mogłyby w zasadzie pozwolić programom przesiewowym oferować częstsze lub bardziej czułe badania w stosunku do stosunkowo niewielkiej grupy kobiet o wyższym ryzyku, podczas gdy pozostałe kontynuowałyby standardowe trzyletnie kontrole. Jednak różnice między narzędziami i między systemami obrazowania pokazują, że żaden pojedynczy model AI nie jest gotowy do powszechnego wdrożenia bez starannych testów. Autorzy apelują o duże badania prospektywne z użyciem wielu algorytmów oraz o dopracowanie pod kątem lokalnych skanerów i populacji, zanim oparte na ryzyku, nadzorowane przez AI przesiewy piersi staną się bezpieczną rutyną opieki.

Cytowanie: Rothwell, J., Payne, N., Kilburn-Toppin, F. et al. Performance of breast cancer risk prediction algorithms across mammography systems in the UK screening programme. npj Digit. Med. 9, 330 (2026). https://doi.org/10.1038/s41746-026-02507-7

Słowa kluczowe: badania przesiewowe raka piersi, sztuczna inteligencja, mammografia, predykcja ryzyka, raki intervalowe