Clear Sky Science · tr

Görme engelli kullanıcılar için erişilebilirlik ve kullanılabilirliği gerçek zamanlı etkileşim kişiselleştirmesiyle geliştiren davranışa uyumlu bir yapay zeka asistanı

2026-03-09 · Dizine geri dön

Neden Daha Akıllı Sesler Önemli

Konuşturan bilgisayarlar telefonlarımızda, hoparlörlerimizde ve dizüstü bilgisayarlarımızda giderek yaygınlaşıyor. Ancak görme engelli kişiler için bu sesler yalnızca bir kolaylık değil—bilgiye, işe ve günlük görevlere açılan bir can simidi. Bu makale, görme engelli kullanıcıların söylediklerine değil, gerçek zamanlı olarak nasıl tepki verdiklerine de kulak veren ve kendi konuşma tarzını nazikçe yeniden şekillendirerek takip etmeyi kolaylaştıran ve kullanım yorgunluğunu azaltan yeni bir konuşan asistan türü olan AURA’yı tanıtıyor.

Günlük Araçlar Hâlâ Yetersiz Kalıyor

Günümüzün ekran okuyucuları ve sesli asistanları ekranları okur veya soruları yanıtlar, ancak genellikle herkese aynı şekilde konuşurlar. Sabit bir hızda konuşma eğilimindedirler, ya çok ayrıntı verir ya da çok az ve içeriği katı bir sırayla sunarlar. Birçok görme engelli kullanıcı için bu “tek beden herkese uyar” yaklaşımı, önemli olanı yakalamaya ya da yetişmeye çalışırken tekrarlanan tekrar oynatmalara, sık atlamalara ve zihinsel yüklenmeye yol açar. Önceki araştırmalar konuşma hızını, ayrıntı miktarını ve dilin karmaşıklığını değiştirmenin büyük fark yaratabileceğini göstermiştir, ancak çoğu araç konuşma ilerledikçe otomatik olarak uyum sağlamaz.

Yeni Bir Dinleme Biçimi

AURA (Adaptive User-Responsive Assistant), bu modeli değiştirmek üzere tasarlandı. Bu, güçlü bir dil modelini—ileri düzey sohbet botlarının arkasındaki aynı genel teknolojiyi—kullanarak ve bir oturum sırasında kullanıcının nasıl davrandığını izlemenin basit ama akıllı bir yolunu birleştiren ses tabanlı bir sistemdir. Uzun anketlerden veya sabit kullanıcı profillerinden tahmin etmek yerine, AURA üç doğal işareti gözlemler: bir kullanıcının bir yanıtı ne sıklıkla tekrar oynattığı, bir mesajı ne sıklıkla yarıda kestiği ve işlem yapmadan önce ne kadar süre dinlediği. Bu ipuçları ek donanım gerektirmez, göz hareketi veya kalp atış hızı gibi özel verileri açığa çıkarmaz ve insanların konuşan sistemleri zaten kullandığı şekilde doğal olarak oturur.

Asistanın Anında Nasıl Uyumu Sağladığı

AURA’nın içinde etkileşim kapalı bir döngüde yürür. Önce kullanıcı konuşur ve sözleri metne dönüştürülür. Sistem daha sonra üç ayarlanabilir düğmeyi saklayan hafif bir profil getirir: konuşma hızı, cevapların uzunluğu ve dilin ne kadar basit ya da karmaşık olması gerektiği. Bu profil, dil modeline gönderilen istemi şekillendirir ve model kullanıcıya uygun olmayı amaçlayan bir yanıt üretir. Metin, seçilen ayarlarla konuşmaya dönüştürülür ve kullanıcıya çalınır. Bu yanıt sırasında ve sonrasında AURA, kullanıcının tekrar oynatıp oynamadığı, atlayıp atlamadığı veya tamamen dinleyip dinlemediğini sessizce kaydeder ve bir sonraki tur için profili ayarlar. Birkaç karşılıklı değiş tokuş içinde asistan, kullanıcıya daha uygun bir konuşma biçimine ‘‘odaklanır’’—tüm bunlar kullanıcıdan herhangi bir ayar menüsünü değiştirmesini istemeden yapılır.

Fikri Güvenli Bir Kum Havuzunda Test Etmek

Bu kural tabanlı uyumun gerçekten mantıklı davrandığını görmek için araştırmacı insan gönüllülerle başlamadı. Bunun yerine çalışma, üç yaygın deseni taklit eden simüle edilmiş kullanıcı profilleri kullandı: ayrıntıları yakalamakta zorlandığı için sıkça tekrar oynatan, cevaplar çok uzun hissettirdiği için sıkça atlayan ve hızlı, yoğun yanıtları tercih eden. Her profil için sistem, uyumlu ve uyumsuz durumlarda birçok kısa oturum çalıştırdı. Çalışma daha sonra tekrar oynatmalar ve atlamaların ne sıklıkla gerçekleştiğini, görevlerin ne kadar sürdüğünü ve asistanın iç ayarlarının hedef profile uyup uymadığına dair kararlı bir desene oturup oturmadığını ölçtü. Resmi istatistikler yapılmadı—bu tam bir kullanıcı denemesinden ziyade bir fizibilite kontrolüydü—ancak sayılar açık kaymaları gösterdi.

Erken Sayılar Ne Anlatıyor

Tekrara eğilimli koşullar altında, AURA’nın uyumlu sürümü, sabit, uyumsuz bir düzene göre tekrar oynatma olaylarını yaklaşık üçte iki oranında azalttı. Atlama eğilimli koşullarda ise sistem cevapları daha kısa ve öz tutmayı öğrendiğinde atlamalar yaklaşık yarı yarıya düştü. Tüm simüle edilmiş profillerde asistan, çoğu oturumda hedef tarza uyan kararlı ayarlara ulaştı ve standart çok adımlı bir görevi tamamlamak uyum etkin olduğunda yaklaşık beşte bir daha kısa sürdü. Önemli olarak, uyum kuralları basit ve şeffaftı: tekrarlanan tekrarlar asistanı daha yavaş konuşma ve daha basit dil yönünde itmiş; sık atlamalar ise daha kısa, yoğun yanıtlar yönünde itmişti. Bu tasarım, sistemi kara kutu öğrenme modelinden daha anlaşılır ve hata ayıklaması daha kolay tutar—yardımcı teknolojide güvenlik ve güven için anahtar bir kaygıdır.

Gerçek İnsanlar İçin Ne Anlama Geliyor

Araştırma dünyasının dışındaki okuyucular için temel çıkarım, konuşan bilgisayarların daha düşünceli dinleyiciler haline gelebileceğidir. ‘‘Bunu tekrar oynattın mı?’’ veya ‘‘Beni yarıda kestin mi?’’ gibi doğal işaretlere dikkat ederek bir asistan, özellikle sesli ortama bağımlı olan görme engelli ve görme kaybı olan kullanıcılar için daha az sinir bozucu ve daha verimli konuşmayı çabucak öğrenebilir. Mevcut çalışma henüz günlük deneyimin daha iyi olduğunu kanıtlamıyor, çünkü gerçek insan davranışı yerine bilgisayar tarafından üretilen davranışlarla test edildi. Ancak bu, görme engelli kullanıcılarla yapılacak gelecekteki çalışmalar, daha zengin konuşmalar ve çok dilli destek için hem teknik hem de kavramsal altyapıyı oluşturuyor. Bu sonraki adımlar başarılı olursa, AURA gibi araçlar yardımcı teknolojiyi katı, tek yönlü okuma makinelerinden, kendilerini gerçek zamanlı olarak kullanan kişilere uyarlayan yanıt veren ortaklara doğru kaydırmaya yardımcı olabilir.

Atıf: Algamdi, S.A. A behaviour-adaptive AI assistant enhancing accessibility and usability for blind users through real-time interaction personalization. Sci Rep 16, 12666 (2026). https://doi.org/10.1038/s41598-026-43320-2

Anahtar kelimeler: görme engelli erişilebilirlik, uyumlu sesli asistan, davranış farkındalıklı yapay zeka, büyük dil modelleri, yardımcı teknoloji