Clear Sky Science · tr

LingualAI’ı Değerlendirmek: Yapay Zekâ Temelli Gerçek Zamanlı Çevirinin Sertifikalı İnsan Tercümanlara Karşı Prospektif Doğrulaması

· Dizine geri dön

Doktor Muayenehanesinde Dil Boşluklarını Kapatmak

Amerika Birleşik Devletleri’nde milyonlarca insan, İngilizceyi akıcı konuşmadıkları için doktorlarıyla iletişim kurmakta güçlük çekiyor. Profesyonel tercümanlar yardımcı olabilir, ancak özellikle yoğun kliniklerde, kırsal bölgelerde veya gece geç saatlerde her zaman erişilebilir olmuyorlar. Bu çalışma, İngilizce–İspanyolca gerçek zamanlı çeviri sunan telefon tabanlı yerli bir araç olan LingualAI’in, insan tercümanın zor ulaşıldığı durumlarda doktor ve hasta arasındaki konuşmaları güvenli biçimde destekleyip destekleyemeyeceğini inceliyor.

Figure 1. Yapay zekâ aracı, farklı dilleri konuşan doktorlar ve hastaların ziyaretler sırasında birbirlerini anlamalarına yardımcı oluyor
Figure 1. Yapay zekâ aracı, farklı dilleri konuşan doktorlar ve hastaların ziyaretler sırasında birbirlerini anlamalarına yardımcı oluyor

Dil Desteğinin Sağlık İçin Neden Önemli Olduğu

ABD’de 25 milyondan fazla insan İngilizceyi “çok iyi”nin altında konuşuyor ve bu dil farkı tanıların yanlış anlaşılmasından takip randevularının kaçırılmasına ve daha kötü sağlık sonuçlarına kadar çeşitli sorunlarla bağlantılı. Araştırmalar, hastalar tercih ettikleri dilde konuşabildiklerinde bakımın genellikle daha güvenli ve etkili olduğunu gösteriyor. Yine de hastaneler ve klinikler, özellikle birinci basamak ve acil bakım ortamlarında, her ziyareti karşılayacak kadar sertifikalı tercümana sahip değil. Yapay zekâ araçları yaygınlaştıkça, sağlık sistemleri bunların hastaları riske atmadan bu boşluğu kısmen doldurup dolduramayacağını sorguyor.

Araştırmacılar LingualAI’ı Nasıl Test Etti

UTHealth Houston ekibi, İngilizce ve İspanyolca olmak üzere üç gerçekçi kulak-burun-boğaz kliniği senaryosu oluşturdu ve her biri için klinisyen ve hasta rolleri için yazılı metinler hazırladı. Ana dili bu diller olan kişiler her satırı kaydetti; bu kayıtlar iki şekilde çevrildi: sertifikalı tıbbi tercümanlar tarafından ve LingualAI ile. Dokuz iki dilli klinisyen, kaynaklarını bilmeleri engellenmiş anonim ses kliplerini dinledi ve beş puanlı bir ölçekte değerlendirdi. Tıbbi terimlerin doğruluğu, anlamın netliği, çevirinin bütünlüğü ve konuşmanın doğal ve kültürel açıdan uygun olup olmadığı gibi birçok kalite boyutunu puanladılar.

Figure 2. Yapay zekâ çeviri tıbbi anlamı doğru tutuyor ancak konuşma, insan tercümana kıyasla daha az doğal geliyor
Figure 2. Yapay zekâ çeviri tıbbi anlamı doğru tutuyor ancak konuşma, insan tercümana kıyasla daha az doğal geliyor

Anlam ve Üslup Hakkında Çalışmanın Bulguları

En önemli soru olan —temel tıbbi mesajın karşı tarafa ulaşıp ulaşmadığı— konusunda yapay zekâ sistemi şaşırtıcı derecede iyi performans gösterdi. Hem tıbbi terminoloji hem de genel anlam bakımından LingualAI’ın puanları sertifikalı tercümanlara çok yakındı. Araştırmacılar önceden yapay zekânın ne kadar daha kötü olabileceğini ve hâlâ “yeterince iyi” sayılacağını tanımlamışlardı ve LingualAI anlam, terminoloji ve mesajın bütünlüğü için bu eşiği karşıladı. Başka bir deyişle, bu kontrollü testlerde araç genellikle doğru tıbbi bilgiyi doğru dilde ifade etti.

İnsan Tercümanların Hâlâ Öne Çıktığı Alanlar

Sözlerin nasıl iletildiğine odaklanıldığında tablo değişti. İnsan tercümanlar dilbilgisi, kelime seçimi ve kültürel uyumda açıkça daha yüksek puan aldı; aynı zamanda konuşmanın akıcılığı, doğallığı ve ifade zenginliği açısından da üstün oldular. Yapay zekânın sesi daha mekanik eğilimliydi; garip duraklamalar ve tekdüze bir ton, rahatlatma veya empatiyi daha az samimi gösterebiliyordu. Hangi versiyonu tercih ettikleri sorulduğunda değerlendiriciler konuşma akışı, ritim ve genel güven açısından insan tercümanları güçlü biçimde tercih ettiler. Bu farklılıklar, yapay zekânın bu iletim odaklı alanlarda insanlardan “daha kötü değil” standardını karşılayamamasına yol açtı.

Hız, Maliyet ve Paylaşılan Sorumluluk Modeli

LingualAI her söylenen cümleyi yaklaşık on saniyede çevirdi; bu da doğal bir karşılıklı konuşma akışına uymaya yetecek hızdaydı. Ayrıca geleneksel telefon veya görüntülü tercüme hizmetlerine kıyasla çalıştırması çok daha ucuzdu; 10 dakikalık bir konuşma için tahmini maliyetleri birkaç sente karşılık insan hizmetinin birkaç dolarına denk geliyordu. Bu nedenle yazarlar bir “tercüman-arada” modelini öneriyor. Bu yaklaşımda LingualAI rutin, düşük riskli diyalogları üstlenirken, kritik kararlar, duygusal konuşmalar veya yapay zekânın güveni düşük olduğunda ya da bir klinisyen veya hasta insan yardımı istediğinde sertifikalı tercümanlar devreye girecek.

Hastalar ve Klinikler İçin Ne Anlama Geliyor

Dil engeliyle karşılaşan insanlar için bu çalışma temkinli bir iyimserlik sunuyor. LingualAI, özellikle yaygın İngilizce–İspanyolca konuşmalar için tıbbi anlamı diller arasında makul düzeyde taşıyabiliyor gibi görünüyor. Aynı zamanda araç, sıcaklık, nüans ve yüksek riskli konuşmaların güvenilirliği açısından insan tercümanların gerisinde kalıyor. Yazarlar, yapay zekâ çevirinin sertifikalı tercümanların yerini almaması gerektiği; ancak insan yardımı geciktiğinde veya ulaşılamadığında, en hassas ve en önemli bakım bölümlerinde insan uzmanlar yer almaya devam ettiği sürece faydalı bir yedek olabileceği sonucuna varıyor.

Atıf: Singh, U.P., Jaimes Garcia, C.A., Aisenberg, G.M. et al. Evaluating LingualAI: a prospective validation of AI-based real-time translation against certified human interpreters. npj Health Syst. 3, 29 (2026). https://doi.org/10.1038/s44401-026-00080-5

Anahtar kelimeler: tıbbi çeviri, dil engelleri, sağlıkta yapay zekâ, klinik iletişim, tercümanlar