Clear Sky Science · pl

Udoskonalone rozpoznawanie raka szyjki macicy przy użyciu nowej bayesowskiej metody fuzji zespołowej z wyjaśnialną sztuczną inteligencją

2026-03-05 · Powrót do spisu

Dlaczego to ma znaczenie dla zdrowia kobiet

Rak szyjki macicy nadal pozostaje istotną przyczyną zgonów kobiet na całym świecie, szczególnie tam, gdzie dostęp do specjalistów i zaawansowanych badań jest ograniczony. Choroba ta jest jednak wysoce uleczalna, jeśli zostanie wykryta wcześnie. Badanie to analizuje, jak starannie zaprojektowana sztuczna inteligencja (SI) może przekształcić proste informacje kliniczne i dotyczące stylu życia — takie jak wiek, nawyki palenia czy wyniki rutynowych badań przesiewowych — w wysoce wiarygodne narzędzie wczesnego ostrzegania, którego lekarze mogą używać przy łóżku chorego lub w małych przychodniach.

Globalny problem kryjący się za liczbami

Rak szyjki macicy jest w dużej mierze spowodowany zakażeniem wysokiego ryzyka typami wirusa brodawczaka ludzkiego (HPV). Często rozwija się po cichu, dając niewiele objawów aż do zaawansowanego stadium, kiedy kobiety mogą doświadczać nieprawidłowego krwawienia, bólu miednicy lub niepłodności. W 2020 roku zgłoszono ponad 600 000 nowych przypadków na całym świecie, a niemal 90% zgonów miało miejsce w krajach o niskich i średnich dochodach, gdzie regularne badania cytologiczne lub testy na HPV są trudne do utrzymania. Istniejące metody przesiewowe są skuteczne, ale mogą być pracochłonne, wymagać wykwalifikowanego personelu i wciąż pomijać niektóre przypadki. To stwarza wyraźną potrzebę narzędzi, które potrafią dokładnie wskazać kobiety o wysokim ryzyku, korzystając z informacji, które już gromadzą przychodnie.

Przekształcanie historii pacjentek w wynik ryzyka

Naukowcy stworzyli hybrydowy system uczenia maszynowego, który analizuje 36 elementów informacji od każdej pacjentki. Obejmują one wiek, liczbę partnerów seksualnych, wiek przy pierwszym stosunku, status palenia, stosowanie hormonalnej antykoncepcji, historię chorób przenoszonych drogą płciową oraz wyniki powszechnych badań szyjki macicy, takich jak próby Schillera i Hinselmanna oraz cytologia. Ponieważ rzeczywiste dokumentacje medyczne często zawierają luki, zespół zastosował technikę nazwaną GAIN, aby inteligentnie uzupełnić brakujące wartości przy zachowaniu realistycznych wzorców w danych. Następnie użyli metody Boruta, aby przesiewać wszystkie zmienne i zachować tylko te, które w istotny sposób wpływały na to, czy biopsja — złoty standard — wykazała raka lub zmiany przednowotworowe.

Zrównoważenie rzadkich przypadków i wyodrębnianie wyraźnych sygnałów

Jak w wielu medycznych zestawach danych, rejestry raka szyjki macicy zawierały znacznie więcej kobiet bez choroby niż z nią. Jeśli pozostawić to bez korekty, model komputerowy może uczyć się głównie na grupie większościowej i pomijać subtelne oznaki raka. Aby temu zapobiec, zespół zastosował losowe nadpróbkowanie (random oversampling), aby uzyskać bardziej zrównoważony stosunek przypadków pozytywnych do negatywnych. Następnie skompresowali dane do mniejszego zestawu informatywnych wzorców przy użyciu dwóch narzędzi matematycznych: niezależnej analizy składowych (ICA) i analizy głównych składowych (PCA). To połączenie usunęło szum i redundancję, zachowując jednocześnie kluczowe sygnały odróżniające pacjentki wysokiego ryzyka od niskiego ryzyka.

Pogrom dwóch „umysłów” w jedną decyzję

W sercu systemu znajduje się nowy „bayesowski zespół fuzji”, który łączy mocne strony dwóch szeroko stosowanych modeli: drzew decyzyjnych i lasów losowych. Zamiast pozwolić, by każdy model głosował po równo, metoda fuzji waży ich wkład w zależności od tego, jak dobrze wypadają podczas walidacji. W efekcie powstaje pojedyncza, ostrzejsza estymacja ryzyka dla każdej kobiety. W wielokrotnych rundach testów podejście to osiągnęło około 99,9% dokładności, zidentyfikowało każdy przypadek wysokiego ryzyka (perfekcyjna czułość) i uzyskało idealny wynik na standardowej miarze jakości diagnostycznej (AUC‑ROC = 1,00), co sugeruje, że rzadko pomijało raka, jednocześnie unikając niepotrzebnych alarmów.

Otwieranie „czarnej skrzynki” dla lekarzy

Ponieważ lekarze muszą rozumieć, dlaczego algorytm oznacza pacjentkę jako wysokiego ryzyka, zespół dodał narzędzia wyjaśnialnej SI zwane SHAP i LIME. Metody te rozkładają każdą prognozę i pokazują, które czynniki przesunęły decyzję w stronę „rak” lub „brak raka”. Potwierdziły one, że wyniki Schillera, Hinselmanna i cytologii były najsilniejszymi czynnikami ryzyka, przy czym wiek, liczba partnerów seksualnych, palenie i przebyte zakażenia również odgrywały istotne role. Na koniec badacze opakowali model w aplikację internetową, której przychodnie mogą używać w czasie rzeczywistym: personel wprowadza informacje o pacjentce, system zwraca wynik ryzyka, a panel wyjaśnień podkreśla główne powody stojące za tym wynikiem.

Co to oznacza dla pacjentek i przychodni

Praca ta pokazuje, że przy przemyślanym zaprojektowaniu i przejrzystym wyjaśnieniu, SI może przekształcić rutynowe dane kliniczne i behawioralne w potężny system wczesnego ostrzegania przed rakiem szyjki macicy. Model nie zastępuje biopsji ani oceny ekspertów, ale może pomóc przeładowanym pracą przychodniom szybko wychwycić kobiety, które najbardziej potrzebują dalszych badań, zwłaszcza w warunkach ograniczonych zasobów. Przy większych i bardziej zróżnicowanych zbiorach danych w przyszłości oraz rozszerzeniu podejścia na inne typy danych zdrowotnych, takie narzędzia mogłyby stać się integralną częścią codziennych badań przesiewowych i pomóc zapobiec tysiącom unikniętych zgonów.

Cytowanie: Islam, O., Assaduzzaman, M., Akter, S. et al. Enhanced cervical cancer diagnosis using a novel Bayesian fusion ensemble method with explainable AI. Sci Rep 16, 12306 (2026). https://doi.org/10.1038/s41598-026-35334-7

Słowa kluczowe: badanie przesiewowe raka szyjki macicy, medyczna SI, uczenie maszynowe, zdrowie kobiet, wczesne wykrywanie