Clear Sky Science · he

חיזוי ביצועי ספורטאים בהתבסס על מודל רגרסיה גרדיאנטי

2026-02-18 · חזרה לאינדקס

מדוע חיזוי ביצועים חשוב

כל מי שצופה בספורט תוהה מדוע חלק מהספורטאים ממשיכים להשתפר בעוד אחרים נתקעים, גם כשהם נראים כאילו מתאמנים באותה אינטנסיביות. המחקר בוחן האם נתונים מודרניים ואלגוריתמים יכולים להפוך את החידה לכלי מעשי: דרך לחזות עד כמה ספורטאי צפוי להופיע טוב בהתבסס על גילו, שעות האימון, שעות השינה, התזונה ופקטורים יומיומיים אחרים. תחזיות כאלה יכולות לסייע למאמנים לכוונן תוכניות אימון, להפחית סיכון לפציעות ולתמוך בהחלטות מחוץ למגרש.

ממספרים גולמיים לציון ביצועים יחיד

החוקרים עבדו עם מאגר נתונים ציבורי של 1,000 ספורטאים המכיל פרטים דמוגרפיים (כמו גיל ומין), מדדי גוף, נפח אימון, שינה, הכנה נוזלית ותזונה, לצד ציון ביצועים כולל. מאחר שנתוני העולם האמיתי מטונפים, הם תחילה ניקו וארגנו את המידע: ערכים חסרים הושלמו באופן סביר, המדידות הותאמו לסולמות השוואתיים, וקטגוריות כמו סוג תוכנית האימון הומרו לצורה מספרית. בנוסף הנפיקו אותות נוספים, כגון עומס אימון (שילוב שעות ואינטנסיביות), והשתמשו בשיטות בחירת תכונות כדי לשמור רק על הקלטים המידעיים ביותר. כך נוצר תיאור קומפקטי אך עשיר של כל ספורטאי שניתן להזין למודלים שונים לחיזוי.

כיצד המודל החכם לומד דפוסים

במקום להסתמך על סטטיסטיקה קווית קלאסית, הצוות פנה לשיטה שנקראת רגרסיה גרדיאנטית, שבוצעה באמצעות ערכה פופולרית הידועה בשם XGBoost. במקום לנסות להסביר ביצועים בצעד אחד, שיטה זו בונה הרבה כללי החלטה קטנים, או "לומדים חלשים", האחד אחרי השני. כל לומד חדש מתמקד בשגיאות שנעשו על ידי הקודמים, ומתקן בהדרגה את טעויות המודל. התהליך נשלט בקפידה באמצעות הגדרות כמו שיעור הלמידה, עומק העץ ומספר הצעדים, ומנוטר עם אימות צולב: הנתונים מחולקים שוב ושוב לחלקי אימון ואימות כך שהמודל נבחן תמיד על ספורטאים שהוא טרם ראה. עצירה מוקדמת מונעת מן המודל להתאים יתר על המידה לפרטיות בנתוני האימון.

השוואה מול שיטות אחרות

כדי לבדוק האם אסטרטגיה זו בשכבות אכן עוזרת, המחברים השוו את הרגרסיה הגרדיאנטית עם מספר אלטרנטיבות מוכרות: רגרסיה פשוטה וקווי הרידג', רגרסיית מכונת וקטורים תומכת, יער אקראי ורשת עצבית קטנה. הם העריכו ביצועים בעזרת שלושה מדדים נפוצים: כמה מהשונות בציונים המודל יכול להסביר, ועד כמה גדולות השגיאות הטיפוסיות שלו. לאורך 10 סבבי אימות צולב ועל סט מבחן נפרד, הרגרסיה הגרדיאנטית יצאה כטובה ביותר. היא הסבירה כ-92% מהשונות בציוני הביצועים והציגה את השגיאות הממוצעות והגדולות הקטנות ביותר, בעוד שבמקרים רבים עקפה גם את הרשת העצבית והיער האקראי. בדיקות ויזואליות—כגון רישום צפיות חיזויות מול בפועל ובחינת דפוסי השגיאות שנותרו—הראו כי התחזיות שלה תואמות היטב את המציאות ולא סטו קשות עבור ספורטאים חלשים או חזקים באופן קיצוני.

לראות מה מניע הצלחה

תחזיות עוצמתיות שימושיות רק אם מאמנים וספורטאים יכולים להבין אותן. כדי לפתוח את "תיבת השחורה" של המודל, החוקרים השתמשו בטכניקת הסבר בשם SHAP, שמעריכה עד כמה כל גורם לדחוף תחזית כלפי מעלה או מטה. זה איפשר להם לדרג אילו משתנים השפיעו ביותר על ציוני הביצועים בקבוצה ולבחון כיצד שילובים ספציפיים עיצבו את התחזית של פרט מסוים. אף שהמחקר מדגיש שמדובר באסוציאציות ולא בהוכחה של סיבתיות, הניתוחים הצביעו על שעות אימון, שינה ותזונה כגורמים בעלי השפעה בולטת—מה שחוזר על חוכמה שכיחה אך כעת מגובה בתצפית שיטתית מונחת נתונים. בדיקות שאריות ועקומות למידה הציעו בנוסף שהמודל יציב וחזק ולא שברירי או מותאם יתר על המידה לתת-קבוצה אחת של ספורטאים.

מה זה אומר לספורטאים ולמאמנים

המחברים מסכמים כי קו צינור רגרסיה גרדיאנטית מתוכנן היטב מציע איזון פרקטי: הוא חוזה ביצועי ספורטאים בדיוק גבוה יותר מכלים מסורתיים ומכמה בסיסים של למידה עמוקה, ועדיין נשאר מהיר ומסביר לשימוש יומיומי בספורט. בעקרון, מערכת כזו יכולה לתמוך בתוכניות אימון מותאמות אישית, באזהרות מוקדמות כשהביצועים צפויים לרדת, ובשיחות ברורות יותר בין אנליסטים, מאמנים וספורטאים לגבי אילו הרגלים חשובים ביותר. יחד עם זאת, המחקר התבסס על 1,000 ספורטאים ממקור יחיד ועל תמונות מצב במקום מעקב ארוך טווח. עבודות עתידיות יזדקקו למאגרים גדולים ומגוונים יותר, לעיצובים המודעים לזמן ולמדדי תוצאה ספציפיים לענף לפני שניתן לסמוך על מודל כזה כמדריך אוניברסלי. לעת עתה, הוא מראה שאנליטיקה חכמה ושקופה יכולה להפוך נתוני אימון ואורח חיים שוטפים לתובנה משמעותית לגבי הפוטנציאל האתלטי.

ציטוט: Wei, X., Liang, S. & Diao, W. Prediction of athlete performance based on a gradient regression model. Sci Rep 16, 9724 (2026). https://doi.org/10.1038/s41598-026-40117-1

מילות מפתח: ביצועי ספורטאים, אנליטיקה בספורט, למידת מכונה, גרדיאנט בוסטינג, אופטימיזציית אימון