Clear Sky Science · pl
Porównawcza wydajność modeli LLM i uczenia maszynowego w przewidywaniu powikłań po przezskórnej kifo-plastyce w leczeniu osteoporotycznych złamań kompresyjnych kręgosłupa
Dlaczego to ma znaczenie dla osób z kruchym kręgosłupem
W miarę jak więcej osób dożywa sędziwego wieku, bolesne złamania kręgosłupa spowodowane przerzedzeniem kości stają się coraz powszechniejsze. Powszechnie stosowany zabieg, przezskórna kifo-plastyka, może szybko złagodzić ból, ale wiąże się też z ryzykiem niepożądanych efektów. W tym badaniu pytano, czy nowoczesne narzędzia sztucznej inteligencji, w tym duże modele językowe podobne do popularnych chatbotów, mogą pomóc lekarzom przewidzieć, którzy pacjenci są bardziej narażeni na wystąpienie tych powikłań po zabiegu.

Problem z plecami i jego powszechne rozwiązanie
Osteoporotyczne złamania kompresyjne kręgosłupa występują, gdy osłabione kości kręgosłupa zapadają się, często po niewielkim upadku lub nawet zwykłych codziennych czynnościach. Przezskórna kifo-plastyka ma na celu ustabilizowanie tych złamanych kręgów poprzez wprowadzenie balonu i wypełnienie przestrzeni cementem kostnym, co zazwyczaj zmniejsza ból i przywraca część wysokości zgniecionego kręgu. Cement może jednak czasami wydostać się poza kość, a nowe złamania mogą pojawić się na innych poziomach kręgosłupa miesiące później. Te powikłania mogą powodować poważne problemy, w tym uszkodzenia nerwów, zaburzenia płucne i przewlekły ból, dlatego lekarze chcą narzędzi, które przed operacją zidentyfikują pacjentów o wysokim ryzyku.
Tradycyjne modele komputerowe i osąd ludzki
Przed erą dużych modeli językowych badacze tworzyli tradycyjne systemy uczenia maszynowego, które uczyły się wzorców z danych pacjentów i badań obrazowych. Systemy te potrafią oszacować ryzyko wycieku cementu czy nowych złamań, łącząc wiele informacji, takich jak wiek, gęstość kości, kształt złamania i sposób rozmieszczenia cementu. Równocześnie doświadczeni chirurdzy kręgosłupa formułują własne sądy po przeanalizowaniu tych samych danych. Chociaż starsze modele komputerowe często dobrze działają, wymagają starannego treningu, specjalistycznej wiedzy i zasobów obliczeniowych, co może ograniczać ich zastosowanie w codziennych warunkach szpitalnych.
Testowanie chatbotów
W tym badaniu badacze zgromadzili dane od ponad tysiąca pacjentów leczonych kifo-plastyką w dużym szpitalu w Pekinie. Dla każdego pacjenta zarejestrowano standardowe informacje kliniczne i obrazowe, po czym poproszono dwa duże modele językowe, zestaw tradycyjnych modeli uczenia maszynowego oraz dwóch chirurgów kręgosłupa o przewidzenie, czy cement kostny się przemieści oraz czy pojawią się nowe złamania w późniejszym czasie. Chatboty testowano na dwa sposoby. W trybie zero-shot otrzymywały jedynie dane przypadku i prośbę o prognozę. W trybie few-shot najpierw pokazano im niewielki zestaw przykładowych przypadków z znanymi wynikami, aby sprawdzić, czy uczenie na tych przykładach poprawi ich odpowiedzi.

Co komputery i chirurdzy zrobiły dobrze, a gdzie się mylili
W przewidywaniu wycieku cementu wkrótce po zabiegu duże modele językowe radziły sobie stosunkowo dobrze. Ich wyniki były podobne do najlepszych tradycyjnych modeli komputerowych i nieco lepsze niż oceny chirurgów pracujących samodzielnie. Natomiast w przewidywaniu nowych złamań miesiące później chatboty miały trudności. Ich pierwsze próby były słabe i wyraźnie obciążone tendencją do przewidywania, że prawie każdy pacjent doświadczy nowego złamania. Dostarczenie przykładów poprawiło wyniki częściowo, ale tradycyjne uczenie maszynowe, w szczególności model zwany maszyną wektorów nośnych (support vector machine), wciąż działało bardziej niezawodnie. Chatboty zawiodły również przy identyfikacji szczegółowych podtypów powikłań, takich jak dokładne miejsce wycieku cementu czy który kręg ulegnie kolejnemu złamaniu.
Wsparcie dla lekarzy, ale jeszcze nie narzędzie samodzielne
Jednym z ciekawych ustaleń było to, że chirurdzy czasem odnosili korzyść, widząc wyjaśnienia chatbotów, ale tylko w zadaniach, w których modele już radziły sobie całkiem dobrze. Gdy podstawowe prognozy były słabe, na przykład przy długoterminowych złamaniach, wyjaśnienia nie poprawiały decyzji lekarzy. Ogólnie badanie pokazuje, że obecne duże modele językowe mogą stanowić użyteczne wsparcie dla niektórych krótkoterminowych ryzyk po kifo-plastyce, ale nie są jeszcze wystarczająco niezawodne, aby zastąpić istniejące modele komputerowe czy osąd ekspertów. Na razie należy postrzegać je jako wczesnych asystentów, którzy wciąż wymagają dopracowania, lepszego treningu na danych medycznych i ściślejszej integracji z narzędziami obrazowania, zanim będą mogły bezpiecznie kierować opieką nad pacjentem w świecie rzeczywistym.
Cytowanie: Wang, T., Chen, R., Liang, M. et al. Comparative performance of LLMs and machine learning in predicting complications after percutaneous kyphoplasty for osteoporotic vertebral compression fractures. npj Digit. Med. 9, 401 (2026). https://doi.org/10.1038/s41746-026-02588-4
Słowa kluczowe: osteoporotyczne złamania kręgosłupa, przezskórna kifo-plastyka, duże modele językowe, uczenie maszynowe w medycynie, przewidywanie ryzyka chirurgicznego