Clear Sky Science · he
הערכת איכות פעולה של ספורטאים בהתבסס על ניתוק ניקוד באישורים עצביים מועברים בסצנות ספורט מורכבות
מדוע שיפוט חכם יותר בספורט חשוב
מקפצה אולימפית ועד קרבות ברייקדאנס, ספורטאים רבים נשפטים על ידי אנשי מקצוע שממירים תנועות מורכבות לציון יחיד. אבל ביצועים ארוכים אינם אחידים: יש רגעים מרשימים, אחרים רעועים או פשוט משלימים. במחקר זה נחקר איך בינה מלאכותית יכולה לצפות בסרטונים שלמים של הופעות מורכבות, לזהות את הרגעים החשובים באמת, ולייצר ציונים עקביים ומפורטמים יותר שיכולים לתמוך בשופטים, מאמנים, רופאים ולומדים יומיומיים.
לצפות בכל ההופעה, לא רק בקטעי השיא
מערכות מחשב מסורתיות שמדרגות ביצוע ספורטיבי לעתים מתייחסות לסרטון מלא כאילו כל שניה שווה. הנחה זו קורסת באירועים אמיתיים. בברייקדאנס, למשל, צעדים מוקדמים שמתאימים למוזיקה חשובים פחות מאשר מהלכי רצפה קשים, קפיאים או ספינים כוחיים בשלב מאוחר יותר. שיטות קיימות לעתים מחליקות הכל יחד, מה שמסתיר הן מהלכים מבריקים והן טעויות קריטיות. המחברים מציגים זאת כבעיה כללית בסרטוני מיומנות ארוכים: האיכות משתנה לאורך הזמן, ועדים חיוביים ושליליים יכולים להתקיים באותה ההופעה. המטרה שלהם היא לבנות מערכת שמפרידה בין הרגעים המרכזיים לבין תנועת הרקע, מה שמקל על השוואה של ביצועי שני אנשים בפועל.

שתי דרכים להסתכל על אותה הופעה
המודל המוצע צופה בכל וידאו דרך שתי עדשות נפרדות. זרם "דינמי" מתמקד בתנועה לאורך זמן באמצעות קטעים קצרים, ותופס קצב, זרימה ורציפות. הזרם "סטטי" בוחן פריימים בודדים, ובכך קולט יציבה, שליטה על הגוף ושגיאות טופולוגיות קטנות שעשויות להופיע רק לרגע. באופן מהותי, הזרמים הללו אינם מעורבבים מוקדם. כל אחד מהם לומד תחילה את נקודת המבט שלו על ההופעה, מה שעוזר למנוע מטעויות יציבה רגעיות לטבוע בתוך רצפים חלקים ארוכים, ולהפך. רק לאחר שכל זרם בנה תכונות המודעות לאיכות משלו הם משולבים להערכת ציון כולל.
להפריד מהלכים חזקים מהחלשים
בלב המערכת נמצא מודול "ניתוק ניקוד" שמפריד במפורש קטעי וידאו שנראים כעדות חזקה למיומנות מאלו שמרמזים על ביצוע חלש או פגום. בהשראת רשתות מודרניות מבוססות תשומת לב, המודל לומד שני "אבני דרך" פנימיות: אחת שמזהה רגעים באיכות גבוהה ואחת שמתרכזת ברגעים באיכות נמוכה. כאשר הסרטון מעובד, כל אבני דרך מקצה משקלים שונים לקטעים השונים, ויוצרת שתי סיכומים משלימים: אחד מבוסס על הקליפים שנראים הטובים ביותר, ואחד על הגרועים או הפחות מועילים. גם ממוצע פשוט על פני הזמן נשמר כקו בסיס ניטרלי. כללי אימון מיוחדים דוחפים את תצפיות האיכות־גבוהה והאיכות־נמוכה להבדיל זו מזו בדרכים מועילות ולמקד בחלקים שונים של הווידאו, במקום לקרוס לאותם כמה פריימים ברורים.

ללמוד לדרג הופעות על ידי צפייה בזוגות
במקום להסתמך על ציונים מספריים מדויקים של מומחים אנושיים, המערכת מאומנת בעיקר על השוואות בזוגות: נתונים שני סרטונים, מי מבצע טוב יותר בסך הכל? עבור כל זוג, המודל חוזה ציונים לענפים האיכות‑גבוהה, האיכות‑נמוכה והממוצע ומעניש אם הוא טועה בסדר או אם הענפים המופרדים נכשלו להיות מבחינים יותר מהממוצע הפשוט. תנאי אימון נוספים מעודדים את התצפיות "הטובות" וה"רעות" להדגיש מקטעי זמן שונים. לאחר סיום האימון, המערכת יכולה לצפות בסרטון חדש אחד ולהוציא ציון איכות יציב יחיד, מבלי שצריך להשוותו לסרטון התייחסות בצמוד.
מקרבות ברייקדאנס לניתוחים ולמיומנויות יומיומיות
כדי לבדוק את הגישה שלהם, המחברים בנו מאגר נתונים חדש של קרבות ברייקדאנס ברמה עולמית והעריכו גם את השיטה על שתי אוספים קיימים של סרטוני מיומנות ארוכים: משימות יומיומיות כגון ציור, בישול וקשירת עניבה, ופעילויות כירורגיות ומוטוריות עדינות. בכל ההגדרות המגוונות הללו, המודל שלהם בדרך כלל השיג דיוק שווה או גבוה יותר משיטות מובילות בבחירת איזה משני סרטונים מציג מיומנות גבוהה יותר. ויזואליזציות של מפות התשומת לב הפנימיות שלו מראות שענפי האיכות‑גבוהה נוטים להאיר סביב מהלכים מבוקרים וטכניים תובעניים, בעוד שענפי האיכות‑נמוכה מדגישים מעברי תנועה מגושמים או פעולות לא שלמות. לקורא שאינו מומחה, המסקנה היא שמערכת זו מלמדת מחשבים לא רק לזהות איזו פעולה מתרחשת, אלא עד כמה טוב היא מבוצעת, על ידי הפרדת החלקים הטובים והרעים של ההופעה בקפידה לפני שילובם לציון סופי וניתן להבנה.
ציטוט: Gao, L., Ma, Y., Bi, S. et al. Athlete action quality assessment based on transfer neural network quality score decoupling in complex sports scenarios. Sci Rep 16, 15795 (2026). https://doi.org/10.1038/s41598-026-43987-7
מילות מפתח: הערכת איכות פעולה, ניתוח וידאו של ספורט, ברייקדאנס, מודלים מבוססי תשומת לב, הערכת מיומנות