Clear Sky Science · tr

Karmaşık spor senaryolarında transfer sinir ağı kalite puanı ayrıştırmasına dayalı sporcu hareket kalitesi değerlendirmesi

· Dizine geri dön

Daha akıllı spor hakemliği neden önemli

Olimpik dalışından breakdance mücadelelerine kadar birçok spor, karmaşık hareketleri tek bir puana dönüştürmek için insan hakemlere güvenir. Ancak uzun performanslar dengesizdir: bazı anlar muhteşem, bazıları ise sallantılı ya da sadece dolgu niteliğindedir. Bu çalışma, yapay zekânın karmaşık performansların tüm videolarını izleyip gerçekten önemli anları seçebileceğini ve hakemlere, antrenörlere, doktorlara ve günlük öğrenenlere destek olacak daha tutarlı, ince taneli puanlar üretebileceğini araştırıyor.

Yalnızca özet kesiti değil, tüm gösteriyi izlemek

Athletik performansı puanlayan geleneksel bilgisayar sistemleri sıklıkla tam videoyu her saniyenin eşit derecede önemli olduğu varsayımıyla işler. Bu varsayım gerçek yarışmalarda çöker. Örneğin breakdancing’de müziğe uyan başlangıç adımları, ilerideki zor zemin hareketleri, freeze’ler veya güç dönüşleri kadar önemli olmayabilir. Mevcut yöntemler genellikle her şeyi birbirine karıştırır; bu da hem parlak hareketleri hem de kritik hataları gizler. Yazarlar bunu uzun beceri videolarında genel bir sorun olarak çerçeveliyor: kalite zaman içinde düzensizdir ve pozitif ile negatif kanıtlar aynı performans içinde bir arada bulunabilir. Amaçları, kilit anları arka plan hareketinden ayıran bir sistem inşa ederek iki kişinin gerçekten ne kadar iyi performans gösterdiğini karşılaştırmayı kolaylaştırmaktır.

Figure 1. Yapay zeka, uzun spor ve beceri videolarında hareket ve duruşu ayırarak genel bir kalite puanı verir.
Figure 1. Yapay zeka, uzun spor ve beceri videolarında hareket ve duruşu ayırarak genel bir kalite puanı verir.

Aynı performansa iki farklı bakış

Önerilen model her videoya iki ayrı mercekten bakar. Bir “dinamik” akış, ritmi, akışı ve sürekliliği yakalamak için kısa kliplerle zaman içindeki hareketlere odaklanır. Diğer “statik” akış ise tek tek kareleri inceleyerek duruşu, vücut kontrolünü ve yalnızca anlık olarak görülebilecek küçük form hatalarını tespit eder. Kritik olan, bu akışların erken aşamada karıştırılmamasıdır. Her biri önce performansın kendi görünümünü öğrenir; bu, kısa süreli duruş hatalarının uzun pürüzsüz diziler tarafından boğulmasını veya tersinin olmasını önlemeye yardımcı olur. Ancak her akış kendi kalite farkındalıklı özelliklerini oluşturduktan sonra bunlar birleşerek genel bir puan tahmin edilir.

Güçlü hareketleri zayıf olanlardan ayırmak

Sistemin merkezinde, videodaki güçlü beceri kanıtı gibi görünen segmentleri zayıf veya hatalı uygulamaya işaret edenlerden açıkça ayıran bir “puan ayrıştırma” modülü bulunur. Modern dikkat tabanlı ağlardan ilham alan model, iki iç “prototip” öğrenir: biri yüksek kaliteli anları ararken diğeri düşük kaliteli olanlara odaklanır. Video işlenirken her prototip farklı segmentlere farklı ağırlıklar atar ve iki tamamlayıcı özet üretir: biri en iyi görünen kliplerden, diğeri ise en kötü veya en az yardımcı kliplerden oluşturulur. Nötr bir temel olarak zaman boyunca basit bir ortalama da korunur. Özel eğitim kuralları, yüksek ve düşük kalite görünümlerinin faydalı biçimlerde farklılaşmasını ve videonun farklı kısımlarına odaklanmasını teşvik eder; böylece aynı birkaç bariz karede çökmezler.

Figure 2. Yapay zeka, uzun bir performanstaki en iyi ve en kötü anları vurgular, ardından bunları tek bir kalite puarında birleştirir.
Figure 2. Yapay zeka, uzun bir performanstaki en iyi ve en kötü anları vurgular, ardından bunları tek bir kalite puarında birleştirir.

Çiftleri izleyerek performansları sıralamayı öğrenmek

Sistem, insan uzmanların kesin sayısal puanlarına güvenmek yerine büyük ölçüde ikili karşılaştırmalar üzerinde eğitilir: iki video verildiğinde hangi performans genel olarak daha iyi beceriyi gösteriyor? Her çift için model, yüksek kaliteli, düşük kaliteli ve ortalama dalları için puanlar tahmin eder ve sıralamayı yanlış yaparsa veya ayrıştırılmış dallar basit ortalamadan daha ayırt edici olamazsa ceza alır. Ek eğitim terimleri, “iyi” ve “kötü” görünümlerin farklı zaman segmentlerini vurgulamasını teşvik eder. Eğitim tamamlandıktan sonra, sistem tek bir yeni videoyu izleyip yanına bir referans video gerekmeden tek ve stabil bir kalite puanı verebilir.

Breakdance mücadelelerinden cerrahiye ve günlük becerilere

Yaklaşımlarını test etmek için yazarlar dünya çapında üst düzey breakdance mücadelelerinden oluşan yeni bir veri seti oluşturdular ve ayrıca yöntemi, çizim, yemek pişirme ve kravat bağlama gibi günlük görevler ile cerrahi ve ince motor aktiviteler içeren iki mevcut uzun beceri video koleksiyonunda değerlendirdiler. Bu çeşitli ortamlarda modelleri genellikle hangi iki videodan hangisinin daha yüksek beceriyi gösterdiğini belirlemede önde gelen yöntemlerle eşleşti veya onları aştı. İç dikkat haritalarının görselleştirmeleri, yüksek kaliteli dalların iyi kontrol edilmiş, teknik olarak zorlayıcı hareketlerin etrafında aydınlandığını; düşük kaliteli dalların ise garip geçişleri veya tamamlanmamış eylemleri vurguladığını gösteriyor. Gayri uzman bir okuyucu için sonuç şu: bu sistem bilgisayarlara yalnızca hangi hareketin yapıldığını tanımayı değil, bir performansın en iyi ve en kötü kısımlarını dikkatle ayırdıktan sonra bunları birleştirerek ne kadar iyi yapıldığını da öğretir; böylece nihai, yorumlanabilir bir puan ortaya çıkar.

Atıf: Gao, L., Ma, Y., Bi, S. et al. Athlete action quality assessment based on transfer neural network quality score decoupling in complex sports scenarios. Sci Rep 16, 15795 (2026). https://doi.org/10.1038/s41598-026-43987-7

Anahtar kelimeler: hareket kalite değerlendirmesi, spor video analizi, breakdance, dikkat tabanlı modeller, beceri değerlendirmesi