Clear Sky Science · tr

Farklı elektronik sağlık kayıt sistemleri için maliyet etkin katılımcı seçimiyle federated öğrenme

· Dizine geri dön

Hastane verilerini paylaşmanın neden bu kadar zor olduğu

Modern hastaneler, laboratuvar testlerinden hayati bulgulara, ilaçlardan girişimlere kadar hastalarına ilişkin büyük miktarda dijital bilgi toplar. Teoride, bu kayıtları birçok kurum arasında birleştirmek doktorların kimlerin risk altında olduğunu ve hangi tedavilerin daha faydalı olabileceğini öngören daha akıllı bilgisayar modelleri geliştirmesine olanak sağlar. Ancak pratikte hastaneler farklı yazılım sistemleri kullanır, verileri uyumsuz biçimlerde saklar ve hasta gizliliği ile bütçeleri konusunda sıkı gereksinimlere tabidir. Bu çalışma, hastanelerin veriyi kopyalamadan ya da fazla harcama yapmadan birbirlerinden nasıl öğrenebileceklerini inceliyor.

Ham kayıtları paylaşmadan birlikte eğitim

Yazarlar, her hastanenin kendi hasta kayıtları üzerinde yerel bir model eğittiği ve yalnızca model güncellemelerini paylaştığı, ham verilerin paylaşılmadığı federated learning adlı yaklaşıma dayanıyor. Merkezi bir “ev sahibi” hastane bu süreci koordine eder ve yoğun bakımda komplikasyonları öngörmek gibi kendi ihtiyaçlarına yönelik bir tahmin modelini geliştirmeyi hedefler. Diğer hastaneler, katılımcılar olarak, tazminat karşılığında yer alır. Bu düzenleme hassas kayıtların kurumlar arası taşınmasını önler, fakat iki zor soru ortaya çıkar: çok farklı kayıt sistemleriyle nasıl başa çıkılacağı ve modele gerçekten yardımcı olmayan ortaklar için ödeme yapmaktan nasıl kaçınılacağı.

Figure 1
Figure 1.

Dağınık kayıtları ortak dile dönüştürmek

Elektronik sağlık kayıt sistemleri, bilgileri nasıl etiketleyip kodladıkları bakımından büyük ölçüde farklılık gösterir. Bir hastane kan şekeri testini sayısal bir kod altında saklarken, bir başkası aynı test için farklı bir kod kullanabilir. Geleneksel çözümler her şeyi tek, dikkatle tasarlanmış bir standart veritabanına dönüştürmeye çalışır; bu pahalıdır ve çok sayıda uzman saatine ihtiyaç duyar. Bunun yerine önerilen çerçeve EHRFL, her tıbbi olayı kısa bir metin parçasına dönüştürür. Örneğin bir glukoz ölçümü gibi bir laboratuvar girdisi “laboratuvar olayı glukoz değeri 70 mg/dL” gibi bir ifadeye dönüşür. Her hastanenin zaten yerel kodları insan tarafından okunabilir adlara eşleyen sözlükleri tuttuğu düşünüldüğünde, bu dönüşüm özel el ayarı gerektirmeden otomatikleştirilebilir.

Metinden hasta profilleri oluşturmak

Olaylar metin olarak yazıldıktan sonra, EHRFL her olayı sayısal bir vektöre dönüştürmek için modern dil işleme modellerini kullanır ve ardından birçok olayı tek bir “hasta gömme”sinde birleştirir — bu, bir kişinin belirli bir zaman penceresindeki tıbbi geçmişinin kompakt bir özetidir. Bu gömmeler, hastanede ölüm ya da yoğun bakım yatışı sonrasında böbrek hasarı gibi birden fazla klinik görevi aynı anda ele alan bir tahmin katmanına beslenir. Yazarlar, farklı hastaneleri, dönemleri ve kayıt sistemlerini kapsayan beş büyük, gerçek dünya yoğun bakım veri seti üzerinde federated eğitim yürütürler. Yaygın kullanılan federated yöntemler de dahil çeşitli algoritmalar genelinde, bu metin tabanlı yaklaşımla eğitilen modeller, temel veri formatları farklı olmasına rağmen tek bir hastanede eğitilen modellere kıyasla tutarlı şekilde daha iyi performans gösterir.

Gizliliği korurken doğru ortakları seçmek

Daha fazla ortak hastane her zaman daha iyi sonuç anlamına gelmez. Bazı kurumların hasta popülasyonları veya kayıt kalıpları ev sahibiyle o kadar farklıdır ki, bunları dahil etmek eğitimi yavaşlatabilir veya performansı hafifçe düşürebilir ve yine de maliyet ekler. Bunu ele almak için yazarlar hastanelerin hasta gömmeleri arasındaki benzerliğe dayanan bir seçim adımı önerir. Ev sahibi önce kendi verisiyle bir model eğitir, model ağırlıklarını paylaşır ve her aday hastane bunları kullanarak hasta gömmelerini hesaplar. Gizliliği korumak için her katılımcı gömmelerindeki uç değerleri kırpar, bunları tek bir vektörde ortalayıp üzerine dikkatle kalibre edilmiş rastgele gürültü ekler ve yalnızca bu gürültülü ortalamayı ev sahibine gönderir. Ev sahibi kendi ortalaması ile her konuğun ortalamasını basit benzerlik ölçüleriyle karşılaştırır ve sadece en benzer hastaneleri tam federated çalışmaya dahil eder.

Figure 2
Figure 2.

Doğruluğu kaybetmeden tasarruf

Deneyler, hastanelerin ortalama hasta gömmeleri arasındaki benzerliğin her bir hastanenin ev sahibinin tahmin performansına ne kadar yardım edip zarar verdiğiyle uyumlu olduğunu gösterir. Bu sinyali ortakları seçmek için kullanarak, ev sahibi düşük benzerlikli hastaneleri çıkarırken tüm mevcut siteleri kullanmaya kıyasla tahmin kalitesini koruyabilir veya hatta iyileştirebilir. Yazarlar ayrıca, veri kullanım ücretleri ve eğitim süresinin katılan hastane sayısıyla ölçeklendiğini gösteren bir maliyet modeli sunar; bu nedenle ortak sayısındaki mütevazı azalmalar bile önemli tasarruflara yol açabilir. Aynı zamanda seçim adımı hafiftir: model bir kez eğitilir ve her hastane yalnızca tek bir ortalanmış vektör üzerinde basit hesaplamalar yapar.

Geleceğin sağlık yapay zekâsı için anlamı

Alanın dışındaki okuyucular için ana mesaj, hastanelerin ham hasta kayıtlarını birleştirmeden “birlikte öğrenmesi”ninin ve bunu hem gizliliğe hem de mali sınırlarına saygı göstererek yapmasının mümkün olabileceğidir. Çeşitli kayıtları ortak bir metin biçimine çevirip ardından hasta popülasyonlarının gizliliği korunan özetlerini kullanarak uyumlu ortakları seçmek suretiyle EHRFL, hastane-özgü tahmin araçları geliştirmek için pratik bir reçete sunar. Çalışma yoğun bakım verilerine odaklansa da aynı fikirler ayaktan klinikler, acil servisler ve kuruluşların veri kontrollerini elinde tutarken daha iyi modeller için iş birliği yapmak istediği tıbbi olmayan alanlara bile genişletilebilir.

Atıf: Kim, J., Kim, J., Hur, K. et al. Federated learning for heterogeneous electronic health record systems with cost effective participant selection. Sci Rep 16, 6876 (2026). https://doi.org/10.1038/s41598-026-38299-9

Anahtar kelimeler: federated learning, elektronik sağlık kayıtları, hasta gizliliği, klinik öngörü, sağlık hizmetlerinde yapay zeka