Clear Sky Science · pl

Dobór dawców i biorców przy przeszczepie wątroby z użyciem offline reinforcement learning

2026-03-16 · Powrót do spisu

Dlaczego decyzje dotyczące przeszczepów wątroby mają znaczenie

Dla osób z ciężką chorobą wątroby przeszczep może decydować o życiu lub śmierci — jednak dostępnych jest znacznie mniej organów niż pacjentów, którzy ich potrzebują. Lekarze na bieżąco muszą decydować, czy przyjąć konkretną wątrobę dla danego pacjenta, dalej czekać na lepsze dopasowanie, czy usunąć kogoś z listy oczekujących, jeśli jego stan się poprawi lub pogorszy. Badanie to analizuje, czy pewna forma sztucznej inteligencji, znana jako offline reinforcement learning, potrafi uczyć się na wieloletnich danych transplantacyjnych, by proponować bezpieczniejsze, mądrzejsze decyzje dopasowujące, które uratują więcej żyć i lepiej wykorzystają każdy przekazany organ.

Od jednorazowych prognoz do decyzji rozłożonych w czasie

Większość obecnych narzędzi stosowanych przy przeszczepach wątroby analizuje pojedynczy moment — na przykład dzień operacji — i ocenia prawdopodobieństwo przeżycia pacjenta z danym organem. Często opierają się na skalach takich jak Model for End-Stage Liver Disease (MELD), który agreguje wyniki badań laboratoryjnych do liczby pomagającej priorytetyzować najciężej chorych. Jednak te narzędzia pomijają istotny aspekt rzeczywistości: stan pacjenta zmienia się w ciągu tygodni i miesięcy, a każda decyzja o przyjęciu lub odrzuceniu oferowanego organu wpływa na dalszy bieg zdarzeń, w tym ryzyko zgonu na liście oczekujących. Autorzy zamiast tego przedstawili przeszczep jako sekwencję decyzji w czasie, gdzie każdy wybór — przeszczepić, czekać czy skreślić z listy — prowadzi do różnych możliwych przyszłości.

Nauka komputera na podstawie wcześniejszych decyzji transplantacyjnych

Naukowcy wykorzystali zapisy z amerykańskiego Scientific Registry of Transplant Recipients, skupiając się na ponad 43 000 dorosłych wpisanych na listę do pierwszego przeszczepu wątroby w latach 2017–2022. Dla każdej osoby odtworzyli oś czasu wyników MELD i możliwych ofert dawców, w tym organów, które ostatecznie odrzucono. Na każdym etapie komputer widział cechy pacjenta, parametry potencjalnego dawcy i trzy możliwe działania: czekać, przeszczepić lub skreślić z listy. Otrzymywał następnie sygnał nagrody oparty na tym, co później faktycznie się wydarzyło — czy stan pacjenta się poprawił czy pogorszył, czy przeszczep się powiódł, nie powiódł lub w ogóle nie doszedł do skutku. Korzystając z techniki zwanej Conservative Q-learning, system był trenowany, by faworyzować decyzje, które w wielu takich osiach czasu skutkowały mniejszą liczbą zgonów i nieudanych przeszczepów.

Co zmieniłaby wyuczona polityka

Gdy wytrenowany system przetestowano na odrębnej grupie pacjentów, uniknął on 73% par dawców i biorców, które w rzeczywistości prowadziły do niepowodzenia przeszczepu albo zgonu w ciągu roku od operacji, zachowując jednocześnie 93% udanych przeszczepów. Zidentyfikował też wcześniejsze możliwości transplantacji dla niemal połowy pacjentów, którzy zmarli na liście oczekujących, sugerując, że inne terminy lub dawcy mogliby poprawić ich szanse. Co ważne, w przeciwieństwie do bardzo agresywnych strategii polegających na przeszczepianiu niemal wszystkich, gdy tylko stan się pogorszy, podejście to ograniczało całkowitą liczbę przeszczepów, jednocześnie poprawiając wyniki. W bardziej realistycznej symulacji, gdzie każda wątroba dawcy mogła być użyta tylko raz, a pacjenci opuszczali pulę po przeszczepie lub skreśleniu, model nadal dopasowywał większość pacjentów do dawców, redukując przy tym możliwe do uniknięcia niepowodzenia.

Wskazówki do lepszych dopasowań ukryte w danych

Poza surowymi wskaźnikami wydajności zespół przeanalizował, jakie pary dawca–biorca system preferował. W porównaniu z prostymi regułami opartymi na MELD, wyuczona strategia wybierała pacjentów nieco mniej krytycznie chorych oraz dawców przypominających tych z historycznie udanych przeszczepów — mniej organów marginalnych i mniej biorców wymagających intensywnego podtrzymania życia. Co godne uwagi, model „uratował” też część wątrób, które w praktyce odrzucono, a które wydawały się mieć względnie dobrą jakość. Wybory modelu w grupach już oznaczonych jako „wysokie ryzyko” przez standardowe skale wiązały się z lepszym rzeczywistym przeżyciem, mimo że same te skale nie różniły się, co sugeruje, że algorytm wychwycił złożone wzorce, których brakuje dotychczasowym narzędziom.

Co to może znaczyć dla pacjentów i lekarzy

To rozwiązanie nie jest jeszcze gotowe do użycia przy łóżku chorego, ale pokazuje, że metoda AI trenowana wyłącznie na danych historycznych może lepiej odzwierciedlać rzeczywiste kompromisy związane z przeszczepami wątroby — równoważąc ryzyko zbyt długiego oczekiwania z ryzykiem wykorzystania złego dopasowania. Ucząc się, kiedy powiedzieć tak, nie lub jeszcze nie każdej ofercie organu, podejście to zmniejszyło symulowane niepowodzenia przeszczepów, zachowując większość udanych operacji i dając potencjalne szanse na ratunek wielu osobom, które inaczej mogłyby umrzeć na liście oczekujących. Przy dalszym dopracowaniu, lepszych danych i ostrożnym testowaniu podobne narzędzia wspomagania decyzji mogłyby pomóc zespołom transplantacyjnym mądrzej wykorzystywać każdą przekazaną wątrobę i dać większej liczbie pacjentów trwałą drugą szansę.

Cytowanie: Melehy, A., Feng, J., Amara, D. et al. Liver transplant donor-recipient matching with offline reinforcement learning. npj Digit. Med. 9, 351 (2026). https://doi.org/10.1038/s41746-026-02529-1

Słowa kluczowe: przeszczep wątroby, przydział organów, uczenie przez wzmacnianie, Sztuczna inteligencja w medycynie, dobór dawca-biorca