Clear Sky Science · tr

Çok modlu BBD’lere 12 derivasyonlu elektrokardiyografi görüntülerini anlama öğretilmesi

2026-03-16 · Dizine geri dön

Bilgisayarlara Kalp İzlerini Okutmanın Önemi

Her gün milyonlarca kişinin kalp aktivitesi elektrokardiyogram (EKG) ile kaydedilir. Hekimler genellikle bu kayıtları kıvrımlı çizgilerle dolu basılı veya dijital grafikler olarak görür. Özellikle kaynakları sınırlı kliniklerde, sadece bu görüntüler mevcuttur—ham dijital sinyaller veya gelişmiş yazılımlar yoktur. Bu çalışma, yeni bir yapay zekâ (YZ) türünün EKG görüntülerini doğrudan “okumayı” öğrenebileceğini gösteriyor; böylece dünya çapındaki klinisyenlere daha güvenilir yardım sunma olanağı doğuyor.

Devasa Bir Kalp Görüntüleri Kütüphanesi Oluşturmak

Bir YZ sistemine EKG görüntülerini anlamayı öğretmek için araştırmacıların önce büyük, gerçekçi bir eğitim kütüphanesi oluşturması gerekiyordu. Mevcut EKG veri tabanlarının çoğu, hekimlerin alışık olduğu kağıt benzeri görüntüler yerine ham elektriksel sinyalleri depolar. Ekip bu sinyalleri, kareli çizgiler ve standart düzenlemeler içeren, gerçeğe uygun 12 derivasyonlu EKG resimlerine dönüştürdü. Ayrıca kırışıklıklar, dönmeler, soluk çizgiler, renk değişimleri ve hatta simüle edilmiş kamera fotoğrafları gibi gerçekçi kusurlar ekleyerek EKG’lerin kliniklerde basıldığında, tarandığında veya fotoğraflandığında ortaya çıkan durumları taklit ettiler. Bu görüntüler Avrupa, Kuzey Amerika ve Güney Amerika’dan birkaç büyük hasta grubundan geldi; böylece sistem farklı popülasyonlarda ve hastane düzenlerinde görülen desenleri öğrenebildi.

YZ’ye Gördürdüklerini Anlatmayı Öğretmek

Sadece YZ’ye milyonlarca EKG görüntüsü göstermek yeterli değildir; aynı zamanda anlamlı sorulara nasıl yanıt vereceğini de öğrenmesi gerekir. Ekip, ECGInstruct adını verdikleri bir milyonun üzerinde görüntü-ve-metin çifti koleksiyonu oluşturdu. Her çift, bir EKG görüntüsünü bir göreve bağlıyor: kalp atışının temel özelliklerini saptamak, anormal ritimleri tanımak, hastalık bulgularını belirlemek ya da kısa klinik tarzda bir rapor yazmak gibi. Bunu ölçeklendirmek için araştırmacılar soruları ve cevapları taslak hâline getirmede güçlü bir dil modelinden yararlandı; ardından otomatik kontrol ve uzman incelemesiyle filtreleyip düzelttiler. Bu sayede YZ’ye yalnızca ham görüntüler değil, klinisyenlerin EKG’ler hakkında nasıl düşündüğüne ve konuştuğuna dair zengin örnekler de verildi.

PULSE: Uzmanlaşmış Bir Kalp Okuma Modeli

Bu büyük ve özenle hazırlanmış veri kümesini kullanarak ekip, bir EKG görüntüsüne bakıp metin tabanlı yorumlar üretebilen çok modlu bir YZ modeli olan PULSE’u eğitti. PULSE, görsel desenleri yazılı açıklama ve kararlara bağlayabilmesi için bir görüntü işleme modülünü bir dil modülü ile birleştirir. Birkaç sabit tanıyla sınırlı ya da temiz sayısal sinyallere ihtiyaç duyan önceki sistemlerin aksine, PULSE “Bu EKG normal mi yoksa anormal mi?”den “Ritmi ve başlıca bulguları tanımlayın.”a kadar birçok soru türünü ele alacak şekilde tasarlandı. Ayrıca zor bir olayı bir klinisyenin nasıl muhakeme edeceğini yansıtır biçimde tek bir EKG hakkında çok adımlı konuşmalara girebilir.

Sistemi Teste Sokmak

PULSE’un ne kadar iyi çalıştığını görmek için araştırmacılar EKG görüntüsü anlama için geniş bir test paketi olan ECGBench’i oluşturdular. ECGBench standart tanı görevleri, rapor üretimi, gerçek dünya vakalarında çoktan seçmeli sorular ve bir uzmanla yapılan diyaloga benzeyen çok turlu soru–cevap oturumlarını içerir. Hem alışık olunan veri kümelerinde hem de tamamen yeni olanlarda PULSE, yaygın kullanılan ticari sistemler gibi genel amaçlı YZ modellerine kıyasla doğrulukta yüzde 21–33 puan daha iyi performans gösterdi. Ayrıca özellikle açık uçlu muhakeme gerektiren veya yalnızca basılmış tarzı görüntülerden çalışma gerektiren görevlerde ham sinyallere dayanan önceki EKG odaklı araçları da geride bıraktı. Yan yana örneklerde, PULSE genellikle önde gelen genel YZ modellerinden daha çok uzman yorumlarına yakın raporlar üretti.

Günlük Bakım İçin Anlamı Ne Olabilir

Çalışma, PULSE gibi dikkatle eğitilmiş açık kaynaklı bir YZ’nin EKG görüntülerinin kullanıldığı her yerde çok yönlü bir yardımcı olabileceğini öne sürüyor. Görüntüler üzerinde doğrudan çalıştığı için yalnızca taranmış veya fotoğraflanmış çıktılara sahip kliniklere destek sağlayabilir ve basit evet–hayır etiketlerinin ötesine geçerek daha zengin açıklamalar ve çok adımlı akıl yürütme sunabilir. Bununla birlikte yazarlar, sistemin henüz kardiyologların yerini almadığını vurguluyor. Hâlâ uzman performansının gerisinde kalıyor ve güvenlik, önyargı ve uygun denetim konuları gözetilerek gerçek hastane ortamlarında dikkatle test edilmesi gerekiyor. Yine de bu çalışma, insan kalbinin sağlığını açığa çıkaran kıvrımlı çizgileri daha iyi anlamada klinisyenlere yardımcı olabilecek YZ araçlarına doğru atılmış önemli bir adımı temsil ediyor.

Atıf: Liu, R., Bai, Y., Yue, X. et al. Teaching multimodal LLMs to comprehend 12-lead electrocardiographic images. npj Digit. Med. 9, 349 (2026). https://doi.org/10.1038/s41746-026-02551-3

Anahtar kelimeler: elektrokardiyogram, tıbbi yapay zeka, çok modlu modeller, kalp teşhisi, klinik karar desteği