Clear Sky Science · tr
PoseShot: poz analizi yoluyla serbest atış eylem tanıma için hibrit CNN–BiLSTM dönüştürücü modeli
Klasik Bir Basketbol Şutu İçin Daha Akıllı Antrenman
Serbest atış çizgisine hiç gelmiş olan herkes için, file sesiyle kaçırma arasındaki fark gizemli gelebilir. Bu çalışma yapay zekânın o gizemi nasıl açık, nesnel geribildirime dönüştürebileceğini gösteriyor. Oyuncunun serbest atış sırasındaki vücut duruşunu dikkatle okuyarak, araştırmacıların PoseShot adı verilen sistemi atışı anlaşılır aşamalara ayırıyor ve sağlam bir teknik ile sallantılı bir tekniği ayıran hareketleri ortaya çıkarıyor.

Serbest Atışı Açık Aşamalara Bölmek
PoseShot, serbest atışı tek, basit bir eylem olarak ele almak yerine beş ayrı aşamadan oluşan bir sıra olarak görüyor: dripling, tutma, kaldırma, atış ve takip hareketi. Ekip, farklı spor salonları, aydınlatma koşulları ve kamera açıları altında oyuncuların serbest atış yaptığı 75 video topladı ve sonra binlerce kareyi bu aşama isimleriyle etiketledi. Bu ayrıntılı yaklaşım sisteme çok daha spesifik sorular sorma olanağı sunuyor: Oyuncu tutma aşamasında yeterince uzun mu bekliyor? Kaldırma sırasında kol yolu düzgün mü görünüyor? Takip hareketi her atışta tutarlı mı?
Görsel Bilgisayarla Vücudu Okumak
Oyuncunun ne yaptığını görmek için PoseShot aynı harekete iki tamamlayıcı bakış açısını birleştiriyor. Birincisi, ham video görüntülerine bakıyor ve her karede şekilleri, uzuv pozisyonlarını ve hareket ipuçlarını yakalamak için konvolüsyonel ağ olarak bilinen bir sinir ağı türünü kullanıyor. İkincisi, video üzerinde vücudun 2B eklem konumlarını işaretleyen bir poz tahmin aracı çalıştırıyor. Bu noktalarından dirsekler, kalçalar ve dizler dahil olmak üzere sekiz temel eklem açısı hesaplanıyor. Bu açılar, enerjinin bacaklardan gövdeye, oradan da atış koluna nasıl aktığını yakalayarak oyuncunun duruşunun zamana göre sayısal bir parmak izini oluşturuyor.

İki Hareket Zekası Akışını Harmanlamak
PoseShot’ın kalbi, görüntüleri ve duruşu yan yana işleyen çift yollarlı bir mimaridir. Görüntü akışı görsel ayrıntıları kademeli olarak sıkıştırarak kompakt özelliklere dönüştüren birkaç katmandan geçer. Duruş akışı ise eklem açıları dizisini, bir pozun zamana göre hem ileri hem geri nasıl başka bir pozisyona yol açtığını izleyen özel bir zaman-bilinçli ağa besler. Her iki akışın üzerine, hareketteki en bilgilendirici anları ve ilişkileri vurgulayan dikkat mekanizmaları gibi davranan dönüştürücü katmanlar eklenir. Son olarak, iki akış birleştirilir ve sistem, oyuncunun hangi serbest atış aşamasında olduğunu kare kare belirleyen bir sınıflandırıcıya gönderir.
Diğer Yapay Zeka Koçlarını Geride Bırakmak
PoseShot’ın ne kadar iyi çalıştığını yargılamak için araştırmacılar, klasik görüntü ağlarından modern dönüştürücü tabanlı tasarımlara kadar çeşitli popüler derin öğrenme modelleriyle karşılaştırdılar. Hem doğru isabetleri hem de hatalardan kaçınmayı ödüllendiren dengeli bir metrik kullanıldığında, PoseShot yaklaşık olarak 100 üzerinden 96 puan aldı; genel olarak tüm rakip yöntemleri geride bıraktı ve özellikle kritik atış aşamasında öne çıktı. Sistem, tutma, atış ve takip hareketi gibi net hareketleri tanımada özellikle güçlüydü. En zor ayrımlar ise dripling ile kaldırma arasındaydı; gerçek oyunda bunlar genellikle birbirine karışıyor ve bariz duruş değişiklikleri yerine ince zamanlama ve hız farklarıyla ayrılıyor.
Veriden Eyleme Uygulanabilir Koçluk
Yüksek hızlı video ve eklem ölçümlerini güvenilir aşama etiketlerine dönüştürerek PoseShot, koçlara sadece bir öne çıkarma fragmanı sağlamanın ötesine geçiyor. Bir oyuncunun formunun nerede bozulduğunu, ana pozisyonları ne kadar tutarlı tekrar ettiğini ve hangi hareket parçalarının isabetleri kaçırmalardan ayırdığını görmek için yapılandırılmış bir yol sunuyor. Sistem çok benzer hareketlerde hâlâ zorlanıyor ve şu anda güçlü bilgisayarlarda en iyi şekilde çalışıyor olsa da, çalışma her düzeyde oyuncunun tekniklerinin anında, nesnel çözümler alabileceği bir geleceğe işaret ediyor. Pratikte bu, daha hedefe yönelik antrenman, daha az kötü alışkanlık ve serbest atış çizgisinden potaya daha net bir yol anlamına geliyor.
Atıf: Hsu, WC., Lee, CC., Lee, YH. et al. PoseShot: hybrid CNN–BiLSTM transformer model for free throw action recognition via pose analysis. Sci Rep 16, 11478 (2026). https://doi.org/10.1038/s41598-026-41025-0
Anahtar kelimeler: basketbol serbest atışı, spor analitiği, hareket yakalama, derin öğrenme, eylem tanıma