Clear Sky Science · pl

Zautomatyzowane fenotypowanie chorób okulistycznych z rutynowych dokumentów medycznych przy użyciu małych modeli językowych i Human Phenotype Ontology (HPO)

2026-05-09 · Powrót do spisu

Dlaczego inteligentniejsze czytanie notatek okulistów ma znaczenie

Każda wizyta u okulisty generuje pismo lub raport wypełniony obserwacjami dotyczącymi oczu pacjenta. Te notatki są kluczowe dla opieki, ale zapisywane są w tekście swobodnym, często w różnych językach i z użyciem indywidualnych sformułowań lekarzy. Utrudnia to łączenie informacji między placówkami, budowanie dużych rejestrów badawczych czy szybkie odnalezienie pacjentów z podobnymi problemami. W badaniu pokazano, jak starannie zaprojektowany system sztucznej inteligencji potrafi automatycznie przekształcić te nieuporządkowane narracje w czystą, ustandaryzowaną listę zmian okulistycznych — bez wysyłania wrażliwych danych pacjentów do chmury.

Przekształcanie codziennych notatek w dane ustrukturyzowane

Naukowcy skupili się na narzędziu zwanym Human Phenotype Ontology, światowym katalogu precyzyjnie zdefiniowanych cech medycznych, w tym dotyczących oka. Zamiast polegać na ręcznym wyszukiwaniu i przypisywaniu tych kodów przez lekarzy — co jest czasochłonne i niespójne — zbudowali potok AI, który czyta rutynowe listy okulistyczne i zwraca odpowiadające ustandaryzowane terminy. Celem było uchwycenie bogactwa szczegółów zawartych w rzeczywistych notatkach klinicznych przy jednoczesnym uczynieniu wyników użytecznymi dla badań, kontroli jakości i rejestrów wieloośrodkowych.

Krok po kroku: od tekstu do rozpoznań okulistycznych

Potok działa w czterech głównych etapach. Najpierw zanonimizowane notatki z poradni okulistycznej napisane po niemiecku są tłumaczone na angielski przez kompaktowy model językowy dostrojony przy użyciu przykładowych podpowiedzi. Po drugie, system dzieli dłuższe opisy na krótkie segmenty, z których każdy opisuje pojedynczą cechę przedniego lub tylnego odcinka oka. Po trzecie, filtruje normalne stany i rozpoznaje sytuacje, gdy choroba jest wyraźnie wykluczona, tak by zachować tylko rzeczywiste problemy. Wreszcie każdy pozostały segment jest przekształcany w wektor („embedding”) i dopasowywany do najbliższego wpisu w rozszerzonej, wielojęzycznej wersji Human Phenotype Ontology, co daje konkretny, ustandaryzowany termin fenotypu okulistycznego.

Nauczanie systemu języka opieki okulistycznej

Ponieważ wiele bardzo szczegółowych schorzeń okulistycznych lub sposobów ich opisywania brakowało w standardowym katalogu, zespół stworzył lokalną listę synonimów dostosowaną do ich kliniki. Gdy system wybierał niewłaściwy termin dla fragmentu tekstu, eksperci poprawiali go i dodawali dane sformułowanie jako nowy synonim dla właściwego kodu. Proces „ekspert w pętli” powtarzano na około 10 000 raportów medycznych. Nowe fenotypy okulistyczne, które jeszcze nie istniały w globalnej ontologii, zgłaszano z powrotem do międzynarodowego konsorcjum Human Phenotype Ontology, pomagając udoskonalić wspólny standard dla przyszłych użytkowników.

Jak dobrze AI zgadzało się z ekspertami

Aby ocenić wydajność, badacze losowo wybrali 175 rzeczywistych dokumentacji pacjentów i poprosili doświadczonego okulistę o ręczne oznaczenie ich terminami z ontologii. Średnio ludzie znaleźli 2,53 istotne cechy okulistyczne na list, podczas gdy AI wygenerowało 2,52 — niemal identycznie. Z 342 terminów wskazanych przez ludzi system odnalazł 341. Kluczowe miary dokładności były wysokie: nakład (miara Jaccarda) między zestawami terminów AI i ekspertów wynosił około dwóch trzecich, a zrównoważenie poprawności i kompletności (miara F1) wynosiło około 0,80, co jest porównywalne z nowoczesnymi narzędziami w innych dziedzinach medycyny. Większość pozostałych błędów wynikała z tego, że potrzebny termin okulistyczny po prostu jeszcze nie istniał w ontologii.

Ochrona prywatności danych przy łączeniu informacji

Istotną cechą tego podejścia jest to, że działa ono całkowicie na lokalnym sprzęcie szpitalnym, co pomaga placówkom spełniać surowe przepisy ochrony danych, a jednocześnie udostępniać wartość zapisów. Przekształcając notatki w tekstach swobodnych w ustandaryzowane kody, które nie zawierają już imion ani bezpośrednich identyfikatorów, system wspiera bezpieczniejsze udostępnianie danych do rejestrów i badań. Jego modułowa konstrukcja pozwala innym szpitalom dostosować go do własnych sformułowań i skrótów poprzez modyfikację podpowiedzi i rozszerzanie list synonimów, bez konieczności ponownego trenowania dużych modeli AI.

Co to może znaczyć dla pacjentów i badań okulistycznych

Dla pacjentów takie zautomatyzowane fenotypowanie może oznaczać szybsze rozpoznawanie rzadkich wzorców chorób oraz lepsze dopasowanie i badanie terapii między ośrodkami. Dla lekarzy i badaczy obiecuje szybsze przeglądy dokumentacji, pełniejsze rejestry i mniej godzin spędzonych na ręcznym kodowaniu. Autorzy konkludują, że dobrze ugruntowany potok AI oparty na wyszukiwaniu — zbudowany wokół zaufanej ontologii medycznej i dostrojony do języka lokalnej kliniki — może dokładnie tłumaczyć codzienne notatki okulistyczne na dane ustrukturyzowane, gotowe do badań, torując drogę do szerszego zastosowania AI w rutynowej opiece okulistycznej.

Cytowanie: Thai, B.D., Arens, S., Reinhard, T. et al. Automated phenotyping of ophthalmologic diseases from routine medical records using small language models and the human phenotype ontology (HPO). Sci Rep 16, 14682 (2026). https://doi.org/10.1038/s41598-026-51512-z

Słowa kluczowe: okulistyka, wydobywanie informacji z tekstu klinicznego, fenotypowanie, ontologie medyczne, interoperacyjność danych zdrowotnych