Clear Sky Science · tr

Birinci basamak elektronik sağlık kayıtlarından kronik durumları tanımlamak için doğal dil işleme ve makine öğrenimini kullanmak

2026-02-12 · Dizine geri dön

Doktorunuzun notlarının düşündüğünüzden daha önemli olmasının nedeni

Aile hekiminizi ziyaret ettiğinizde her öksürük, şikayet ve endişe elektronik sağlık kaydınıza yazılır. Bu ayrıntıların çoğu temiz onay kutuları yerine serbest biçimli notlarda saklanır. Bu çalışma, bu anlatı notlarının modern bilgisayar teknikleriyle birleştirildiğinde, özellikle bu sorunlar karttaki diğer yerlerde açıkça kodlanmamışsa, artrit, böbrek hastalığı, diyabet, yüksek tansiyon ve solunum problemleri gibi kronik hastalıkları doktorların daha doğru tespit etmesine yardımcı olabileceğini gösteriyor.

Günlük klinik kayıtlarda gizli ipuçları

Birinci basamakta elektronik sağlık kayıtları iki çok farklı türde bilgi içerir. Faturalama kodları, ilaç listeleri ve laboratuvar sonuçları gibi yapılandırılmış öğeler vardır; bir de klinisyenlerin semptomları, öyküyü ve gerekçelerini normal dilde anlattığı yapılandırılmamış notlar vardır. Kanada’da faturalama kodları genellikle eksik ve daha çok ödeme için kullanıldığından, birçok sağlık sorunu onay kutularında değil notlarda daha belirgin olur. Araştırmacılar, her iki tür bilgiyi birlikte kazımanın, Alberta’daki tek bir aile hekimliği kliniğini ziyaret eden 60 yaş ve üzeri hastalarda beş yaygın uzun süreli durumu daha iyi tanımlayıp tanımlayamayacağını görmek istedi.

Bilgisayarlara doktorların dilini öğretmek

Klinik notların zengin ama dağınık metninden yararlanmak için ekip, bilgisayarların insan diliyle çalışmasına yardımcı olan araçlar olan doğal dil işlemeyi kullandı. Notları rastgele sembolleri kaldırarak, kelimeleri standartlaştırarak, kısaltmaları açarak ve ilişkili sözcükleri ortak köklere indirerek temizlediler. Ayrıca bir notta hastanın bir duruma sahip olmadığını belirten ifadeleri—örneğin “kanıt yok” veya “ekarte edildi” gibi—tanımak için basit kurallar oluşturdular, böylece bilgisayar bu ifadeleri yanlışlıkla pozitif vaka olarak işlemeyecekti. Ekipteki klinisyenler her durum için anlamlı terim ve ifadeler listeleri oluşturdu; bu, algoritmaların her rastgele kelime yerine ilgili tıbbi kavramlara odaklanmasına yardımcı oldu.

Temaları bulmak ve kalıplardan öğrenmek

Sonra araştırmacılar, metni makine öğrenimi modellerine beslenebilecek hale getirmek için nicel hale getirdiler. Her kelimenin veya kelime çiftinin her hastanın notlarında ne sıklıkta göründüğünü saydılar, ancak çok yaygın kelimelerin ağırlığını düşürdüler ve belirli bir durum için özellikle ayırt edici olanları vurguladılar. Konu modelleme adı verilen bir yöntem kullanarak notlardaki en sık kelime gruplarının diyabet veya yüksek tansiyonla ilişkilendirilen terimler gibi ilgi duyulan durumlarla uyuşup uyuşmadığını kontrol ettiler. Bu adım, tahmin modellerini oluşturmadan önce bilgisayar tarafından belirlenen temaların klinik bilgiyle örtüştüğüne dair bir gerçeklik kontrolü işlevi gördü.

Algoritmaların kimlerin hasta olabileceğini işaret etmesine izin vermek

Çalışmanın özünde, her hastanın beş kronik durumdan her birine muhtemelen sahip olup olmadığını belirlemek için üç tür makine öğrenimi modelinin eğitilmesi vardı. Bir model rafine bir risk hesaplayıcısı gibi çalıştı, bir diğeri sağlıklı ve hasta vakalar arasında bir sınır çizdi ve üçüncü model basit bir beyin esinli ağ benzeriydi. Araştırmacılar önce bu modelleri sadece kaydın yapılandırılmış kısımlarını kullanarak eğitti, ardından yapılandırılmış veriler ile notlardan işlenmiş metin özelliklerini birlikte kullanarak yeniden eğitti. Ayrıca bazı hastalıkların örnekte daha az yaygın olduğunu dikkate alarak, nadir koşulların algoritmalar tarafından göz ardı edilmemesi için verileri özenle dengelediler.

Tam hikayeyi kullanmanın açık faydaları

Yapılandırılmamış notlar eklendiğinde, modellerin bir hastanın bir duruma sahip olup olmadığını ayırt etme yetenekleri gözle görülür şekilde iyileşti; özellikle faturalama verilerinde sıklıkla eksik kodlanan sorunlar için. Artrit ve solunum hastalıklarında, modellerin hasta ile sağlıklı hastaları ayırma ve gerçek vakaları güvenilir şekilde işaretleme ölçümleri belirgin şekilde gelişti. Örneğin, solunum problemleri ve artrit tespit performansı notlar dahil edildiğinde orta düzeyden güçlüye yükseldi. Diyabet ve yüksek tansiyon için elde edilen kazançlar daha küçüktü çünkü bu durumlar zaten yapılandırılmış alanlarda iyi yakalanıyordu. İlginç bir şekilde, daha basit modeller genellikle daha karmaşık sinir ağından en az onun kadar iyi ya da daha iyi performans gösterdi; bu da ileri düzey derin öğrenmenin bu tür klinik düzey işlerde her zaman gerekli olmadığını gösteriyor.

Bu, gelecekteki bakımınız için ne anlama geliyor

Genel olarak, çalışma tıbbi kayıtların anlatı kısımlarına—sadece kodlara ve laboratuvar sayılarına değil—dikkat etmenin, kronik hastalığı olan hastaları bulma yeteneğimizi önemli ölçüde keskinleştirebileceğini gösteriyor. Serbest metin notlarını makine tarafından okunabilir sinyallere dönüştürüp bunları mevcut yapılandırılmış verilerle birleştirerek, sağlık sistemleri risk altındaki hastaları daha erken tespit edebilir, takip bakımını en çok ihtiyaç duyulan yere odaklayabilir ve ziyaretin yazılı hikayesinde yaşayan, açılır menülerde değil, diğer koşullara da bu yaklaşımı genişletebilir.

Atıf: Zhang, N., Abbasi, M., Khera, S. et al. Leveraging natural language processing and machine learning to identify chronic conditions from primary care electronic medical records. Sci Rep 16, 8441 (2026). https://doi.org/10.1038/s41598-026-38594-5

Anahtar kelimeler: elektronik sağlık kayıtları, kronik hastalık tespiti, doğal dil işleme, sağlıkta makine öğrenimi, birinci basamak verileri