Clear Sky Science · he

צינור CNN–Bi-LSTM ומאגר פתוח FSW לזיהוי מהלכים בהיאבקות חופשית

2026-03-23 · חזרה לאינדקס

לימוד מחשבים לצפות בהיאבקות

היאבקות חופשית מהירה, מסובכת ומבלבלת לצפייה — אפילו לאנשים. למחשבים, להבחין בהשלכה אחת לעומת אחרת באצטדיון מלא הוא קשה עוד יותר. המחקר הזה מראה כיצד צינור וידאו מתוכנן בקפידה ומאגר ציבורי חדש יכולים לסייע למכונות לזהות טכניקות היאבקות ספציפיות, ולפתוח אפשרויות לאנליטיקה חכמה יותר בספורט, כלי אימון ומערכות ליצירת הדגשים אוטומטיים.

האתגר של ענפי מגע קרוב

רוב מערכות זיהוי הווידאו המודרניות אומנו על קטעים שבהם האנשים יחסית מופרדים וקלים לצפייה, כמו ריצה או הנפת מחבט טניס. היאבקות חופשית שונה: המתחרים צמודים זה לזה, הגפיים חופפות והתמונה מלאה בהסחות דעת כגון שופטים, מזרנים וקהל. מבחני הייחוס הסטנדרטיים אינם משקפים את המורכבות הזו, ולכן שיטות שעובדות טוב על פעולות יומיומיות פעמים רבות נתקעות כשמתאבקים נאבקים, מתגלגלים ומסתובבים במהירות.

בניית ספריה חדשה של מהלכי היאבקות

כדי להתמודד עם הפער הזה, הכותבים יצרו את מאגר Open FSW, אוסף מסונן של 210 קליפים קצרים של היאבקות חופשית. כל קליפ מציג מהלך שלם אחד בדיוק, שנבחר מתוך שבע טכניקות מוגדרות היטב כגון השלכות על האגן, תפסי רגל וגלגולים. הקליפים נלקחו משתי מקורות: אימונים מבוקרים עם קבוצה קטנה של ספורטאים, ומשידורים של תחרויות פומביות, שמוסיפים מגוון בזוויות מצלמה, תאורה ורעש רקע. מומחים ושופטים סייעו בתיוג כל קליפ, והמאגר מחולק כך שקליפים מאותה תחרות או מאותה סשן אימון לעולם לא מופיעים גם באימון וגם במבחן, מה שמפחית את הסיכון להערכת ביצועים מוטעית.

מיקוד על המתאבקים, לא על הקהל

הליבה של הגישה היא ללמד את המחשב "להתמקד" במתאבקים ולהתעלם ברובו ממה שסביבם. כל פריים בווידאו עובר תחילה דרך מודל סגמנטציה שמפריד את הספורטאים מהרקע ומפיק צלליות קדמיות נקיות. הפריימים הקדמיים הללו מעובדים לאחר מכן על ידי רשת תמונה עמוקה שמצמצמת כל תמונה לווקטור מאפיינים דחוס — למעשה סיכום מספרי של צורת המתאבקים ומיקומם באותו רגע. לבסוף, מודל רצף דו-כיווני בוחן את כל סדרת סיכומי הפריימים, מתחילתו ועד סופו ובחזרה, כדי להחליט איזו מהשבע טכניקות מבוצעת בקליפ.

כמה טוב המערכת לומדת מהלכים

החוקרים בחנו מספר מקודדי תמונה פופולריים והשוו את הצינור המודע-לרקע שלהם לשיטות קודמות שהסתמכו בעיקר על קווי שלד של הספורטאים. התצורה הטובה ביותר שלהם, המשולבת בסגמנטציה מכוילת היטב עם שלד תמונה EfficientNet ומודל רצף, מזהה נכון את המהלך בכ־83 אחוז מהקליפים. זהו שיפור ברור על פני בסיס חזק המבוסס של שלד ועל פני גרסאות של המערכת שלהם שמדלגות על שלב הקדמה. הרווחים חזקים במיוחד עבור מהלכים שבהם הגופים מתערבבים באופן חזק והרקע מסיח במיוחד. בדיקות סטטיסטיות על פני קפלים מרובים של הנתונים מאשרות כי השיפורים הללו בלתי סבירים שיקרו במקרה.

פשרות, מגבלות והשפעה רחבה

מיקוד במתאבקים מגיע עם מחיר: הפעלת שלב סגמנטציה נוסף מכפילה בערך את זמן העיבוד לכל קליפ על החומרה שנבדקה. לניתוח לא בזמן אמת — כגון ניתוח לאחר קרב או מחקרים — העומס הזה מקובל, אך יישומים בזמן אמת עשויים להזדקק למודלי סגמנטציה מהירים יותר או למכונות חזקות יותר. המחקר מציין גם שהמאגר יחסית קטן, והם מתמודדים עם זה בעזרת למידה העברתית והגדלת נתונים, וכן שסגמנטציה עלולה להיכשל בטשטוש תנועה קיצוני או בחסימה חמורה של הגוף.

מה זה אומר לאוהדים ולמאמנים

במלים פשוטות, המחקר מראה שניקוי מה שהמחשב רואה — על ידי חיתוך המתאבקים מהסצנה העמוסה לפני ניתוח הפעולה — משפר משמעותית את היכולת לקרוא מהלך ספציפי. בעוד שהתוצאות הנוכחיות מותאמות להיאבקות חופשית, אותו רעיון עשוי לעבור לענפי מגע קרוב אחרים כמו ג'ודו או ג'יו-ג'וטسو ברזילאי. על ידי פרסום המאגר והקוד, הכותבים מספקים בסיס למערכות עתידיות שיפרקו אוטומטית חילופי אחיזות מורכבים, ויעזרו למאמנים, לספורטאים ולאוהדים להבין טוב יותר מה קורה על המזרן.

ציטוט: Rostamian, M., Mottaghi, A. & Soryani, M. A CNN–Bi-LSTM pipeline and open FSW dataset for freestyle wrestling action recognition. Sci Rep 16, 14632 (2026). https://doi.org/10.1038/s41598-026-44782-0

מילות מפתח: היאבקות חופשית, זיהוי פעולות, אנליטיקה בספורט, ראייה ממוחשבת, למידה עמוקה