Clear Sky Science · tr
Gradyan regresyon modeline dayalı atlet performans tahmini
Performansı tahmin etmenin önemi
Spor izleyen herkes bazı atletlerin neden sürekli geliştiğini, bazılarının ise neden platoya ulaştığını merak eder; hatta benzer şekilde antrenman yapıyor gibi görünseler bile. Bu çalışma, modern veri ve algoritmaların bu bilmeceyi pratik bir araca dönüştürüp dönüştüremeyeceğini inceliyor: bir atletin yaşı, antrenman saati, uyku, beslenme ve diğer günlük faktörlere dayanarak ne kadar iyi performans göstereceğinin öngörülmesi. Böyle tahminler antrenörlerin antrenman planlarını ince ayar yapmasına, sakatlanma riskini azaltmasına ve atletlerin saha dışındaki kararlarını daha akıllıca almalarına yardımcı olabilir.
Ham sayılardan tek bir performans puanına
Araştırmacılar, demografik bilgiler (yaş ve cinsiyet gibi), vücut ölçümleri, antrenman hacmi, uyku, hidrasyon ve beslenme ile birlikte genel bir performans puanını içeren 1.000 atletlik açık bir veri kümesiyle çalıştı. Gerçek dünya verileri genellikle dağınıktır; bu yüzden önce bilgileri temizleyip düzenlediler: eksik değerler mantıklı şekilde dolduruldu, ölçümler karşılaştırılabilir ölçeklere getirildi ve antrenman programı türü gibi kategoriler sayısal forma dönüştürüldü. Ayrıca antrenman yükü (saatlerle yoğunluğun birleşimi) gibi ek sinyaller üretip, yalnızca en bilgilendirici girdileri tutmak için özellik seçimi yöntemleri kullandılar. Bu, her atlet için farklı tahmin modellerine verilebilecek kompakt ama zengin bir profil oluşturdu.

Akıllı modelin desenleri nasıl öğrendiği
Klasik doğrusal istatistiklere güvenmek yerine ekip, XGBoost olarak bilinen popüler bir araç setiyle uygulanan gradyan regresyon adı verilen bir yönteme yöneldi. Performansı tek adımda açıklamaya çalışmak yerine bu yaklaşım ardışık olarak birçok küçük karar kuralı veya “zayıf öğrenici” oluşturur. Her yeni öğrenici bir öncekinin yaptığı hatalara odaklanır ve modelin hatalarını kademeli olarak düzeltir. Süreç öğrenme hızı, ağaç derinliği ve adım sayısı gibi ayarlarla dikkatle kontrol edilir ve çapraz doğrulama ile izlenir: veriler, modelin henüz görmediği atletler üzerinde sürekli test edilmesi için tekrar tekrar eğitim ve doğrulama bölümlerine ayrılır. Erken durma, modelin eğitim verilerindeki rastlantısal ayrıntılara fazla uyum sağlamasını engeller.
Diğer yöntemlerle karşılaştırma
Bu katmanlı stratejinin gerçekten işe yarayıp yaramadığını görmek için yazarlar, gradyan regresyonu birkaç tanıdık alternatifle karşılaştırdı: basit doğrusal ve ridge regresyonu, destek vektör regresyonu, rastgele ormanlar ve küçük bir sinir ağı. Performansı, modelin açıklayabildiği puan varyasyonunun miktarı ve tipik hatalarının büyüklüğü olmak üzere üç yaygın ölçütle değerlendirdiler. 10 tur çapraz doğrulama ve ayrı bir test kümesi üzerinde gradyan regresyon önde çıktı. Performans puanlarındaki değişimin yaklaşık %92’sini açıkladı ve ortalama ile büyük hatalarda en düşük değere sahipti; hatta sinir ağı ve rastgele ormanı bile geride bıraktı. Tahmin edilen puanların gerçek puanlarla çizilmesi ve kalan hataların örüntüsünün incelenmesi gibi görsel kontroller, tahminlerin gerçeğe yakın olduğunu ve zayıf ya da güçlü atletler için ciddi sapma göstermediğini ortaya koydu.

Başarıyı neyin yönlendirdiğini görmek
Güçlü tahminler, antrenörler ve atletler tarafından anlaşılabildiğinde işe yarar. Modelin “kara kutusunu” açmak için araştırmacılar, her bir faktörün tahmini ne kadar yukarı veya aşağı ittiğini tahmin eden SHAP adlı bir açıklama tekniği kullandı. Bu, hangi değişkenlerin grup genelinde performans puanlarını en güçlü şekilde etkilediğini sıralamalarına ve belirli kombinasyonların bir bireyin tahminini nasıl şekillendirdiğini incelemelerine olanak sağladı. Çalışma bunların ilişki olduğunu, nedensellik kanıtı olmadığını vurgulasa da analizler antrenman saatleri, uyku ve beslenmeyi özellikle önemli olarak öne çıkardı; bu, yaygın bilgeliği yankılamakla birlikte artık sistematik ve veri odaklı bir bakışla desteklenmiş oldu. Artık kontrolleri ve öğrenme eğrisi grafikleri de modelin kırılgan veya tek bir atlet alt kümesine aşırı uyumlu değil, stabil ve sağlam olduğunu gösterdi.
Atletler ve antrenörler için anlamı
Yazarlar, iyi tasarlanmış bir gradyan regresyon hattının pratik bir denge sunduğu sonucuna varıyor: geleneksel araçlardan ve bazı derin öğrenme temel modellerinden daha doğru atlet performansı tahminleri sağlarken, günlük spor kullanımına yetecek kadar hızlı ve açıklanabilir kalıyor. Prensipte böyle bir sistem kişiselleştirilmiş antrenman planlarını destekleyebilir, performansın düşme olasılığına karşı erken uyarılar verebilir ve analistler, antrenörler ile atletler arasında hangi alışkanlıkların en çok önemli olduğuna dair daha net konuşmalar sağlayabilir. Bununla birlikte çalışma, tek bir kaynaktan alınmış 1.000 atlete ve uzun vadeli izlemeden çok anlık görüntülere dayanmaktadır. Gelecekteki çalışmalar, bu tür bir modelin evrensel bir rehber olarak güvenilir hale gelmesi için daha büyük ve daha çeşitli veri kümelerine, zamana duyarlı tasarımlara ve spor-spesifik sonuç ölçütlerine ihtiyaç olacak. Şimdilik bu çalışma, akıllı ve şeffaf analitiğin rutin antrenman ve yaşam tarzı verilerini atletik potansiyel hakkında anlamlı içgörülere dönüştürebileceğini gösteriyor.
Atıf: Wei, X., Liang, S. & Diao, W. Prediction of athlete performance based on a gradient regression model. Sci Rep 16, 9724 (2026). https://doi.org/10.1038/s41598-026-40117-1
Anahtar kelimeler: atlet performansı, spor analitiği, makine öğrenimi, gradyan güçlendirme, antrenman optimizasyonu