Clear Sky Science · tr

Serbest güreş eylem tanıma için bir CNN–Bi-LSTM hattı ve açık FSW veri kümesi

· Dizine geri dön

Bilgisayarlara Güreşi İzlemeyi Öğretmek

Serbest güreş hızlı, birbirine dolanmış ve izlemesi—insanlar için bile—karmaşık bir spordur. Bilgisayarlar için kalabalık bir arenada bir atışı diğerinden ayırt etmek daha da zordur. Bu çalışma, dikkatle tasarlanmış bir video hattı ve yeni bir açık veri kümesinin, makinelerin belirli güreş tekniklerini tanımasına nasıl yardımcı olabileceğini gösteriyor; bu da daha akıllı spor analitiği, antrenörlük araçları ve otomatik özet oluşturma için kapılar açıyor.

Yakın Temas Sporlarının Zorluğu

Çoğu güncel video tanıma sistemi, insanlar görece ayrı ve kolay görülebilir olduğunda eğitildi—örneğin koşan birini ya da tenis raketi sallayan birini içeren klipler gibi. Serbest güreş farklı: sporcular birbirine kenetlenir, uzuvlar üst üste biner ve sahne hakemler, minderler ve tezahürat yapan kalabalıktan gelen dikkat dağıtıcılarla doludur. Standart değerlendirme setleri bu karmaşıklığı yakalamaz, bu yüzden günlük eylemlerde iyi çalışan yöntemler, güreşçilerin sıkıştığı, yuvarlandığı ve hızla döndüğü anlarda tökezleyebilir.

Yeni Bir Güreş Hareketleri Kütüphanesi Oluşturmak

Bu boşluğu kapatmak için yazarlar Open FSW veri kümesini oluşturdu; 210 kısa serbest güreş klibinden oluşan özenle seçilmiş bir koleksiyon. Her klip yedi iyi tanımlanmış teknikten biri gibi kalça atma, ayak takma ve yuvarlanma süpürme gibi tam bir hareketi gösterir. Klibler iki kaynaktan geliyor: küçük bir atlet grubuyla yapılan kontrollü antrenman oturumları ve kamera açısı, aydınlatma ve arka plan karışıklığında çeşitlilik ekleyen yayın maçları. Uzmanlar ve hakemler her klibi etiketlemeye yardımcı oldu ve veri kümesi, aynı maçtan veya antrenmandan gelen kliplerin eğitim ve testte aynı anda bulunmamasını sağlayacak şekilde bölündü; bu da performansı fazla tahmin etme riskini azaltıyor.

Figure 1
Şekil 1.

Güreşçilere Odaklanmak, Kalabalığa Değil

Yaklaşımın özü, bilgisayara güreşçilere "dikkat etmeyi" ve büyük ölçüde geri kalanını görmezden gelmeyi öğretmektir. Her video karesi önce sporcuları arka plandan ayıran ve temiz ön plan silüetleri üreten bir segmentasyon modelinden geçer. Bu ön plan kareleri daha sonra her görüntüyü kompakt bir özellik vektörüne sıkıştıran derin bir görüntü ağı tarafından işlenir—temelde o andaki güreşçilerin şekil ve pozisyonlarının sayısal özeti. Son olarak, çift yönlü bir sıra modeli, yedi teknikten hangisinin klipte icra edildiğine karar vermek için kare özetlerinin tüm dizisini baştan sona ve geriye doğru inceler.

Sistemin Hareketleri Ne Kadar İyi Öğrendiği

Araştırmacılar birkaç popüler görüntü kodlayıcısını test etti ve ön plan farkındalıklı hatlarını esas olarak atletlerin iskelet konturlarına dayanan önceki yöntemlerle karşılaştırdı. İncelenmiş segmentasyon ile EfficientNet görüntü omurgasını ve bir sıra modelini birleştiren en iyi yapılandırmaları, kliplerin yaklaşık yüzde 83'ünde hareketi doğru tanımladı. Bu, güçlü bir iskelet tabanlı temel modele ve ön plan adımını atlayan kendi sistemlerinin sürümlerine göre belirgin bir iyileşme. Kazançlar, gövdelerin yoğun şekilde iç içe geçtiği ve arka planın özellikle dikkat dağıttığı hareketlerde en güçlü. Verinin birden fazla katında yapılan istatistiksel testler, bu iyileşmelerin şans eseri olma olasılığının düşük olduğunu doğruluyor.

Figure 2
Şekil 2.

Ödünler, Sınırlamalar ve Geniş Etki

Güreşçilere odaklanmak bir maliyeti beraberinde getiriyor: test edilen donanımda ek bir segmentasyon adımı çalıştırmak klip başına işlem süresini yaklaşık iki katına çıkarıyor. Maç sonrası çözümlemeler veya araştırma çalışmaları gibi çevrimdışı analizler için bu ek yük kabul edilebilir, ancak gerçek zamanlı uygulamalar daha hızlı segmentasyon modelleri veya daha güçlü makineler gerektirebilir. Çalışma ayrıca veri kümesinin nispeten küçük olduğunu; bununla başa çıkmak için transfer öğrenme ve veri artırma kullandıklarını ve segmentasyonun aşırı hareket bulanıklığı veya şiddetli örtülme durumlarında zorlanabileceğini not ediyor.

Taraftarlar ve Antrenörler İçin Anlamı

Basitçe söylemek gerekirse, çalışma bilgisayarın gördüklerini temizlemenin—karmaşık sahneden güreşçileri ayırıp sonra eylemi analiz etmenin—belirli hareketleri adlandırmada performansı önemli ölçüde artırdığını gösteriyor. Mevcut sonuçlar serbest güreşe uyarlanmış olsa da aynı fikir judo veya Brezilya jiu-jitsu gibi diğer yakın temas sporlarına da uygulanabilir. Veri kümesini ve kodu yayımlayarak yazarlar, antrenörlerin, sporcuların ve taraftarların minder üzerindeki karmaşık kavrama değiş tokuşlarını otomatik olarak ayrıştırabilen gelecekteki sistemler için bir temel sağlıyor.

Atıf: Rostamian, M., Mottaghi, A. & Soryani, M. A CNN–Bi-LSTM pipeline and open FSW dataset for freestyle wrestling action recognition. Sci Rep 16, 14632 (2026). https://doi.org/10.1038/s41598-026-44782-0

Anahtar kelimeler: serbest güreş, eylem tanıma, spor analitiği, bilgisayarla görme, derin öğrenme