Clear Sky Science · tr

Elektronik sağlık kayıtlarında büyük dil modelleri kullanarak hareketliliğin fonksiyonel durumunun saptanması

2026-01-23 · Dizine geri dön

Yürüme yeteneğinin neden güçlü bir sağlık göstergesi olduğu

İnsanlar daha uzun yaşadıkça, hekimler artık yalnızca yaşam süresine değil, aynı zamanda ne kadar iyi hareket edebildiğimize, yürüyebildiğimize ve kendimize bakabildiğimize de daha fazla dikkat ediyor. Bir sandalyeden kalkmakta, merdiven çıkmakta veya şehir içinde dolaşmakta güçlükler genellikle tıbbi bir krizin çok öncesinde ortaya çıkar. Buna karşın, bir kişinin günlük yeteneklerine dair en ayrıntılı tanımlamalar genellikle elektronik sağlık kayıtları içindeki serbest metin doktor ve terapist notlarına gömülüdür ve bunları bilgisayarların bulması zordur. Bu çalışma, modern büyük dil modellerinin—birçok sohbet botunun arkasındaki aynı yapay zeka türünün—bu notları güvenilir şekilde okuyup hareket tanımlarını yapılandırılmış, aranabilir bilgilere dönüştürüp dönüştüremeyeceğini araştırıyor.

Dağınık notları kullanılabilir hareket verisine dönüştürmek

Araştırmacılar “hareket fonksiyonel durumu”na odaklandı; bunun anlamı bir kişinin vücut pozisyonunu değiştirme, yürüme, nesne taşıma ve kullanma, ulaşım kullanma ve günlük hayatta hareket etme becerisinin genel bir tanımıdır. Minnesota ve Wisconsin’deki üç sağlık kuruluşundan alınan 600 gerçek klinik notu kullandılar; bunların çoğu fiziksel ve mesleki terapi ziyaretlerinden, ayrıca daha genel poliklinik notlarından oluşuyordu. Uzman etiketleyiciler her notu bölüm bölüm taradı ve beş hareket kategorisinden birini tanımlayan her pasajı işaretleyerek hastanın açıkça sınırlı (“bozulmuş”) mı yoksa normal işlev görüyor mu (“bozulmamış”) olduğunu belirledi. Bu uzman etiketleri, yapay zeka sistemini değerlendirmek için altın standart olarak kullanıldı.

Yapay zeka modelinin klinisyen gibi okumayı nasıl öğrendiği

Ekip, açık kaynaklı büyük dil modeli Llama 3’ü kullandı ve hasta verilerinin sağlık sistemini terk etmemesi için bunu güvenli yerel sunucularda çalıştırdı. Modeli baştan eğitmek yerine, modele neye bakacağını öğretmek için dikkatle hazırlanmış istemler—yazılı talimatlar ve tanım setleri—kullandılar. Yalnızca talimat veren “sıfır-örnek” istemleri ve az sayıda örnek not içeren “birkaç-örnek” istemleri denediler. Ardından modelin nerede hata yaptığı analiz edilip, nelerin dahil edilmesi gerektiğini, nelerin görmezden gelinmesi gerektiğini (örneğin gelecekteki tedavi planları) ve düşme, baş dönmesi veya tekerlekli sandalye kullanımı gibi zor durumların nasıl ele alınacağını açıkça belirten “hata bilgili” bir istem oluşturdular. Yapay zekadan, her not bölümü ve her hareket kategorisi için hareketliliğin bahsedilip bahsedilmediği ve bahsediliyorsa hastanın bozulmuş olup olmadığı soruldu.

Güçlü performans hasta düzeyinde iyileşiyor

Uzman etiketlerine karşı değerlendirildiğinde, rafine edilmiş sistem iyi performans gösterdi. Tüm notları birleştiren hasta düzeyinde—tüm notlarındaki bilgileri toplayarak—yapay zeka hareketlilik bilgisini bulmada yaklaşık 0,88 F1 puanına ve kişinin bozulmuş olup olmadığı kararında 0,90 F1 puanına ulaştı (yaygın bir doğruluk ölçütü). Bu, modelin yargılarının insan değerlendiricilerle yakından uyuştuğu anlamına geliyor. Notların tek tek bölümleri düzeyinde ifade seyrek veya belirsiz olabildiğinden performans biraz daha düşüktü, ancak bilgiler bütün notlar içinde ve sonra bir hastanın tüm notları boyunca toplandıkça doğruluk arttı. İkinci bir analizde araştırmacılar “klinik olarak makul çıkarımları” doğru saydı—örneğin, yürürken şiddetli diz ağrısının yürümeyi muhtemelen sınırladığı varsayımı, açıkça belirtilmemiş olsa bile. Bu daha hoşgörülü bakış altında, hasta-düzeyi F1 skorları çıkarım için 0,96’nın üzerine ve bozulma sınıflandırması için 0,95’in üzerine çıktı.

Yapay zekanın nerede hata yaptığı—ve bunun neden yine de önemli olduğu

Hataların çoğu modelin satır aralarını okumasından kaynaklandı. Model sık sık ağrı, baş dönmesi veya gelecekteki terapi planlarına dayanarak hareket sorunlarını çıkarım yaptı; oysa notta hastanın sınırlı olduğuna açıkça değinilmiyordu. Diğer hatalar, yinelemeli düşmelerin yürüyüş sorunu mu yoksa pozisyon değiştirirken denge sorunu mu olarak sınıflandırılacağı gibi tanımlardaki gri alanları yansıtıyordu. Günlük aktiviteler ve egzersizi kapsaması amaçlanan “hareketlilik, belirtilmemiş” sınıfını belirlemek özellikle zordu. Bu sorunlara rağmen, hatalar genellikle rastgele veya tuhaf değil, klinik açıdan mantıklıydı. Modeli kilitlenmiş yerel sunucularda deterministik (dahili rastgelelik olmadan) çalıştırarak ekip ayrıca sonuçların yeniden üretilebilir olmasını ve hasta gizliliğinin korunmasını sağladı.

Bu, yaşlı yetişkinlere yönelik bakımı nasıl değiştirebilir

Bir uzmanın olmayan kişi için çıkarım şu: bir yapay zeka sistemi artık rutin doktor ve terapist notlarını hastaların ne kadar iyi hareket ettiğini ve nerede zorlandıklarını özetleyecek kadar iyi okuyabiliyor. Bu, sağlık sistemlerinin yeni anketler veya testler eklemeden zaman içinde yürüme, denge ve günlük aktivitelerdeki değişiklikleri izleyebileceği, düşme veya hastaneye yatış riski yüksek kişileri işaretleyebileceği ve kimlerin fizik tedavi veya ev güvenliği değerlendirmesinden yararlanabileceğini belirleyebileceği anlamına geliyor. Milyonlarca serbest metin notu yapılandırılmış hareketlilik verisine dönüştürerek, bu yaklaşım hekimlerin yaşlanma ve hastalığın günlük yaşamı nasıl etkilediğini daha geniş bir açıdan görmesine yardımcı olur—sağlık bakımını gerçekten kişiselleştirilmiş, fonksiyon merkezli tıpa doğru bir adım daha yaklaştırır.

Atıf: Liu, X., Garg, M., Jia, H. et al. Mobility functional status ascertainment in electronic health records using large language models. Sci Rep 16, 6045 (2026). https://doi.org/10.1038/s41598-026-37025-9

Anahtar kelimeler: hareketliliği, elektronik sağlık kayıtları, büyük dil modelleri, fonksiyonel durum, klinik yapay zeka