Clear Sky Science · tr
Akıllı telefon videolarında epileptik ile fonksiyonel nöbetleri ayırt etmede çok modlu büyük dil modellerinin tanısal doğruluğu
Telefon videonuz bir nöbetin teşhisine nasıl yardımcı olabilir
Birisi aniden yere düştüğünde veya titremeye başladığında, seyirciler artık sıkça aynı şeyi yapıyor: akıllı telefonlarını çıkarıp kayda başlıyorlar. Bu videolar hayati ipuçları olabilir; doktorların olayı epileptik bir nöbet mi yoksa fonksiyonel nöbet adı verilen benzer görünümlü bir atak mı olduğuna karar vermesine yardımcı oluyor. Ancak uzman nörolog sayısı sınırlı ve bir uzmanı bekleyerek videoların incelenmesi tedaviyi geciktirebilir. Bu çalışma, modern yapay zekanın —özellikle çok modlu büyük dil modellerinin— bu sıradan telefon kliplerini kendi başına izleyip farkı söyleyip söyleyemeyeceğini sorguluyor.

Benzer görünen iki acil durum
Epileptik ve fonksiyonel nöbetler eğitimsiz bir göze benzer görünebilir, ancak nedenleri ve tedavileri oldukça farklıdır. Epileptik nöbetler beyindeki anormal elektriksel aktiviteden kaynaklanır ve genellikle ilaçla veya cerrahiyle tedavi edilir. Buna karşılık fonksiyonel nöbetler bu tür beyin deşarjlarıyla tetiklenmez; gerçek ve sıkıntı verici olaylardır, karmaşık beyin–zihin etkileşimlerine dayanır ve çoğunlukla psikolojik destek gerektiren farklı bir bakım yaklaşımı ister. Olaylar kısa ve korkutucu olduğu için aileler bunları doğru tarif etmekte zorlanır. Anında çekilen video kayıtları daha sadık bir görüntü sunar, ancak bunların incelenmesi hâlâ nitelikli epilepsi uzmanlarına erişime bağlıdır.
Genel amaçlı yapay zekayı teste sokmak
Büyük bir epilepsi merkezindeki araştırmacılar, hastane video–EEG izlemiyle dikkatle tanısı konmuş 15 yetişkinden alınan 24 akıllı telefon videosunu topladı; video–EEG hem beyin dalgalarını hem davranışı kaydeden altın standarttır. Ondokuz klip epileptik nöbetleri, beş klip ise fonksiyonel nöbetleri gösteriyordu. Ardından her videoyu, hiçbir arka plan tıbbi bilgisi olmadan, bir genel amaçlı yapay zeka ailesinin dört sürümüne (Gemini 1.5 Pro, 2.0 Flash, 2.5 Flash ve 2.5 Pro) verdiler. Her modelden basit bir soruya yanıt isteniyordu: olay epileptik miydi yoksa fonksiyonel mi? Yapay zeka ayrıca 1–10 arası bir ölçekle ne kadar emin olduğunu belirtmek zorundaydı. Ekip, yapay zekanın yanıtlarını hastane tanılarıyla karşılaştırdı ve doğruluk, duyarlılık (epileptik nöbetlerin ne sıklıkla doğru tespit edildiği) ve özgüllük (fonksiyonel nöbetlerin ne sıklıkla doğru dışlandığı) gibi standart ölçümleri hesapladı.
Yapay zekanın doğru ve yanlışları
Daha yeni yapay zeka sürümleri eskilere göre daha iyi performans gösterdi, ancak hiçbiri bir uzmanın yerini alacak kadar iyi değildi. Genel tanısal doğruluk en erken modelde yaklaşık üçte bir doğruyken, en yeni iki modelde biraz %50’nin üstüne çıktı. En yeni sistem olan Gemini 2.5 Pro en dengeli olandı: epileptik nöbetlerin biraz daha fazlasını tespit etti ve çoğu fonksiyonel nöbeti doğru şekilde reddetti, ancak hepsini değil. Önceki sürümler ise son derece ihtiyatlıydı: fonksiyonel nöbetleri neredeyse hiç yanlış etiketlemiyorlardı, fakat epileptik nöbetlerin büyük çoğunluğunu kaçırdılar. Önemli olarak, basitçe her olayı “epileptik” olarak etiketleme gibi saf bir strateji, ham doğruluk açısından herhangi bir modelden daha yüksek bir oran sağlayabilirdi; fakat bu, iki durumu ayırt etmede tamamen başarısız olurdu ve bu görevin ne kadar zorlu olduğunu vurguluyordu.
Video ayrıntılarının neden bu kadar önemli olduğu
Çalışma ayrıca videonun kalitesi ve çerçevenin yapay zekanın performansını güçlü biçimde etkilediğini ortaya koydu. Kayıtlar net, iyi ışıklandırılmış ve üst vücut veya yüze odaklı olduğunda, en yeni modeller bu alt kümede yaklaşık %80–90 doğruluk gösteriyordu. Tüm vücut uzak mesafeden gösterildiğinde veya aydınlatma zayıf olduğunda doğruluk keskin şekilde düştü, bazen neredeyse sıfıra indi. Nöbet tipi de fark yarattı: erken yapay zeka sürümleri titreme içermeyen, daha ince belirtili olaylarda büyük ölçüde başarısız olurken, sonraki sürümler belirgin titreme ile daha az dramatik ataklar arasında biraz daha dengeli performans gösterdi. Ancak tüm modellerde güven skorları, yanıt doğru ya da yanlış olsun yüksek kaldı; bu, yapay zekanın sıklıkla “kendinden emin biçimde yanlış” olduğu anlamına geliyor — klinisyenlerin veya hastaların bu yargılara güvenmesi durumunda kaygı verici bir özellik.

Hastalar ve hekimler için bunun anlamı
Şimdilik mesaj net: genel amaçlı yapay zeka nöbet videolarında desenleri fark edebiliyor ve yavaşça gelişiyor, ancak tek başına güvenilir bir tanı aracı olmaktan çok uzak. Sistemler hâlâ birçok epileptik nöbeti kaçırıyor, ince olaylarla zorlanıyor ve ne zaman yanlış olabileceklerini henüz bilmiyor. Yazarlar, gelecek sürümlerin çok daha büyük, yüksek kaliteli ve uzmanlarca etiketlenmiş tıbbi video koleksiyonları üzerinde eğitilmesi, belirsizliği daha iyi ifade etme yöntemleri ve hastaların öyküleri ile beyin dalgası kayıtlarıyla daha yakın entegrasyon gerektireceğini savunuyor. Bu araçların nörologların yerini almak yerine, akıllı telefonlar, uzmanlar ve dikkatle tasarlanmış yapay zekanın birlikte çalıştığı, insan merkezli daha geniş bir yaklaşımın parçası haline gelmesi ve nöbet tanısını hızlandırıp keskinleştirmesi daha muhtemeldir.
Atıf: Patel, A., Vallamchetla, S.K., Safa, A. et al. Diagnostic accuracy of multimodal large language models in differentiating epileptic from functional seizures in smartphone recorded videos. Sci Rep 16, 11719 (2026). https://doi.org/10.1038/s41598-026-46333-z
Anahtar kelimeler: epilepsi, nöbet videoları, yapay zeka, büyük dil modelleri, tıbbi tanı