Clear Sky Science · tr

Stüdyo ve gerçek dünya veri kümelerinde kendine zarar verme tespiti için eylem tanıma modellerinin kıyaslanması

2026-01-31 · Dizine geri dön

Hastaları Dijital Gözlerle İzlemek

Psikiyatri hastanelerinde hemşireler, özellikle kendilerine zarar verme riski taşıyan hastaların güvenliğini sağlamak için yorulmadan çalışır. Yine de en adanmış personel bile her odayı, her saniyeyi izleyemez. Bu çalışma, yapay zekânın (YZ) servis kameralarından gelen videoları otomatik olarak tarayarak kendine zarar verme belirtilerini erken safhada tespit edip edemeyeceğini araştırıyor — insan bakımının yerini almak değil, ek bir koruma katmanı sunmak amaçlanıyor.

Kendine Zarar Vermeyi Yakalamayı Zorlaştıran Nedenler

Kendine zarar verme — insanların kendi kendilerine verdikleri kasıtlı yaralar — genellikle kısa, gizli anlarda gerçekleşir: bir battaniyenin altında hızlı bir çizik ya da görüş alanı dışında kullanılan küçük bir alet gibi. Psikiyatri servisleri düzenli kontroller ve kamera gözetimine güveniyor, ancak görüş boşlukları, personel yorgunluğu ve gece ya da tatil dönemlerindeki sınırlı personel nedeniyle sürekli dikkat mümkün olmuyor. Aynı zamanda gerçek hasta görüntülerinin kaydedilmesi ve paylaşılması ciddi gizlilik ve etik kaygıları doğuruyor. Sonuç olarak, araştırmacıların gerçek zamanlı tehlikeli davranışları algılayacak YZ sistemlerini eğitmek için çok az gerçekçi videoları oldu.

YZ için Daha Güvenli Test Yatakları Oluşturmak

Bu çıkmazı kırmak için araştırmacılar iki tür video veri kümesi oluşturdu. İlk olarak, dört yataklı bir psikiyatri odası gibi düzenlenmiş bir stüdyoda hasta giysili yedi genç oyuncu, önceden planlanmış sahneleri canlandırdı. Plastik kapaklar, dudak kremi tüpleri veya küçük çiviler gibi günlük nesneler aradılar, ardından bilek, önkol veya uylukta kısa kendine zarar verme hareketlerini oynadılar ve tavan kameraları her köşeden kaydetti. Uzmanlar her video segmentini normal davranış veya kendine zarar verme olarak etiketleyerek temiz, dengeli 1120 kliplik bir koleksiyon oluşturdu. İkinci olarak, ekip on ay boyunca güvenlikli psikiyatri servislerinden gerçek gözetim görüntüleri topladı. Klinikler, kaşıma, tırmalama veya kesme gibi davranışlara ilişkin notlar için tıbbi kayıtları taradı ve ardından eşleşen videoları buldu. Yüzleri bulanıklaştırıp kimlik bilgilerini kaldırdıktan sonra, karşılaştırma için 59 gerçek kendine zarar verme klibi ve 59 normal klip bir araya getirildi.

Günümüzün En İyi Video YZ’sini Sınamak

Bu veri kümeleriyle ekip, insanların videoda ne yaptığını anlamaya yönelik eylem tanıma sistemlerinin önde gelen örneklerini kıyasladı. Bazıları kısa kare dizilerini analiz eden daha eski konvolüsyonel ağlara dayanırken, daha yeni dönüştürücü (transformer) tabanlı modeller mekân ve zaman boyunca desenleri bağlamak için dikkat mekanizmalarını kullanıyor. Tüm modeller yalnızca stüdyo videoları üzerinde, bir klibin kendine zarar verme mi yoksa normal davranış mı olduğunu belirleyecek şekilde eğitildi. Önemli olarak, araştırmacılar katı bir test düzeni kullandı: her turda bir oyuncunun tüm klipleri tamamen yeni test verisi olarak tutuldu; böylece algoritmaların bireysel kişileri ezberlemesi engellendi.

Temiz Stüdyo Videoları Dağınık Gerçeklikle Karşılaştığında

Düzenli stüdyo görüntülerinde, VideoMAEv2 adlı en gelişmiş dönüştürücü model öne çıktı. Diğerlerine göre kaçırma ve yanlış alarmları daha iyi dengeliyor, yaklaşık 0,65 F1 puanına (kesinlik ve duyarlılığın birleşik ölçüsü) ulaşıyordu; daha basit yöntemler ise rastgele tahmin seviyelerinde dolaşıyordu. Görsel açıklamalar bu modelin, arka plan hareketlerinden ziyade bir aracın cilde değdiği noktaya sıkı şekilde odaklandığını gösterdi. Ancak aynı eğitilmiş sistemler gerçek servis kayıtlarına —hiç yeniden eğitim yapılmadan— uygulandığında performansları düştü. VideoMAEv2 şansa göre hâlâ daha iyiydi ve yaklaşık 0,61 F1 puanı elde etti, fakat simüle edilmiş verilerde hiç yer almamış tırmalama ve picking (doku koparma) gibi ince davranışlarla ve kameraya uzak, küçük ya da kısmen gizlenmiş hastalarla özellikle zorlandı.

Bu Hastalık Güvenliği İçin Ne Anlama Geliyor

Genel olarak sonuçlar açık bir “simülasyondan gerçeğe” boşluğu ortaya koyuyor. Özenle sahnelenmiş videolarda umut verici görünen YZ sistemleri, gerçek hastane yaşamının karmaşası, tuhaf açılar ve çeşitli davranışlarla karşılaştığında başarısız olabilir. Çalışmanın ana katkısı tamamlanmış bir güvenlik ürünü değil, bir başlangıç noktasıdır: kamuya açık, iyi açıklanmış bir stüdyo veri kümesi, dikkatle toplanmış bir gerçek dünya test seti ve mevcut yöntemlerin nerede çöktüğünü gösteren şeffaf bir kıyaslama. Uzman olmayanlar için mesaj net: YZ şimdiden servis video akışlarındaki şüpheli anları vurgulamaya yardımcı olabilir, ancak henüz tek başına güvenilecek bir bekçi olarak kullanılamaz. Bu boşluğu kapatmak için daha zengin, daha çeşitli eğitim verileri ve gizlilik, adalet ve klinik değerlendirme ön planda tutularak geliştirilecek daha akıllı modeller gerekecek.

Atıf: Lee, K., Lee, D., Ham, HS. et al. Benchmarking action recognition models for self-harm detection in studio and real-world datasets. Sci Rep 16, 6850 (2026). https://doi.org/10.1038/s41598-026-36999-w

Anahtar kelimeler: kendine zarar verme tespiti, psikiyatri servisleri, video eylem tanıma, sağlık hizmetlerinde yapay zeka, hasta güvenliği