Clear Sky Science · he
ניתוח חיזוי של מעורבות סטודנטים בקורסי חינוך גופני באוניברסיטה המבוסס על אלגוריתם טרנספורמר מולטימודלי
מדוע זה חשוב לסטודנטים ולמורים
שיעורי ספורט באוניברסיטה נועדו לחזק כשירות גופנית, לבסס הרגלי אימון טובים ולהرفع את המורל, אך עדיין ישנם חדרי כושר ומגרשים שבהם נרשמת נוכחות נמוכה והשתתפות חצי‑לבית. המחקר הזה מראה כיצד נתונים ממכשירים לבישים, מצלמות בכיתה ומשוב כתוב קצר יכולים להיות משולבים כדי להעריך באופן אוטומטי עד כמה הסטודנטים באמת מעורבים במהלך שיעורי חינוך גופני, ולהציע למורים תובנות מהירות ואובייקטיביות יותר מאשר רשימות בדיקה מסורתיות או סקרים בסיום הסמסטר.
הפיכת שיעורי ספורט לזרמי נתונים עשירים
בקורסי חינוך גופני מודרניים הסטודנטים לעתים חובשים מכשירים שעוקבים אחר דופק, צעדים ותנועה, בזמן שמצלמות לתעדו פעילויות קבוצתיות ופלטפורמות מקוונות אוספות הודעות והערות קצרות. החוקרים משתמשים במאגר נתונים לאומי רחב שמجمع את הזרמים הללו עבור 1,000 סטודנטים באוניברסיטה על פני אלפי שעות שיעור. כל חתיכה של עשר דקות שיעור מתוייגת על ידי מומחים מאומנים כהצגה של מעורבות נמוכה, בינונית או גבוהה, בהתבסס על האופן שבו הסטודנטים נעים, עד כמה גופם עובד קשה ומה הם אומרים על השיעור. פרוסות מתוייגות אלו משמשות כרצפת אימון למודל מחשב שלומד לקרוא מעורבות מתוך נתונים גולמיים במקום מתוך התרשמויות מפוזרות.

לימוד מודל לקרוא גוף, פנים ומילים
במקום להסתמך על מקור מידע יחיד, המחקר בונה מודל מרובד המטפל בחיישנים, טקסט ווידאו כשותפים שווים. עבור אותות חיישן כגון דופק והאצה, רשת מעבדת רצפים לומדת לזהות דפוסים כמו מאמץ מתמשך או פרצי פעילות חוזרים. עבור תגובות הסטודנטים והרהורים קצרים, מודל שפה מדחס משפטים למיצגים קומפקטיים שמקודדים גישה וטון. עבור קטעי וידאו, רשת נוספת מפצלת כל פריים לתמונות מקטעות ולומדת כיצד הבעות פנים, יציבת גוף ודפוסי תנועה מתפתחים לאורך זמן. שלוש הזרמים מתורגמים לאחר מכן לחלל מספרי משותף כדי שהמודל יוכל להשוות ולשלב ביניהם ביעילות.
כיצד המודל מקשר אותות למעורבות
הליבה של הגישה היא טכניקה המאפשרת לזרמי נתונים שונים להתייחס זה לזה באמצעות מנגנון תשומת לב. ראשית, המודל מחזק כל זרם בנפרד, ולומד מבנה פנימי כגון מגמות בדופק או רגעים מפתח בוידאו. לאחר מכן הוא מקשר בין הזרמים, שואל שאלות כמו אילו תקופות זמן בנתוני החיישן תואמות אזכורים בכתיבה על עייפות, או אילו מקטעי וידאו מתיישבים עם שפה שעשויה להצביע על התלהבות. באמצעות לימוד הקישורים החוצי‑זרמים, המערכת בונה תמונה מרוכזת של מה שמתרחש עם כל סטודנט בחלון של עשר דקות. לבסוף, תמונה משולבת זו מוזנת לשכבת פלט פשוטה המפיקה הן ציון מעורבות רציף והן קטגוריה בשלוש רמות.

עד כמה המערכת עובדת בפועל
כשחוקרים משווים את המודל המולטימודלי שלהם למגוון שיטות קיימות שמשתמשות רק בחיישנים, רק בווידאו או רק בשני סוגי נתונים, הם מוצאים שיפורים ברורים. המערכת החדשה מקטינה את שגיאת החיזוי ביותר מחמישית בהשוואה לקו בסיס חזק המבוסס על חיישנים בלבד ומגיעה לדיוק של מעל 90 אחוז במיון רמות המעורבות. חשוב מכך, היא עושה זאת במהירות מספקת לשימוש במהלך השיעור, תוך כ‑0.2 שניות לעיבוד עשר דקות של נתונים עבור סטודנט אחד. בדיקות שהסירו כל פעם סוג נתונים אחד הראו שכל שלושת המקורות תרמו ערך, כשהווידאו הוא התורם הגדול ביותר, אחריו הטקסט ואז החיישנים. ניתוח נוסף של דפוסי תשומת הלב הפנימיים של המודל מרמז שהוא מתמקד באיתותים הגיוניים, כגון קישור בין עליית דופק לתנועה פעילה ולאחר מכן לעייפות.
מה זה יכול להצביע עבור שיעורי ספורט עתידיים
המחברים מסכמים שמערכת מולטימודלית מתוכננת בקפידה יכולה לספק תמונות עכשוויות ומדיוק סביר של מעורבות הסטודנטים בחינוך גופני, ולהזיז את ההערכה מהתרשמויות גסות לעבר תובנה רציפה מונחית נתונים. למרות שהגישה תלויה במצלמות ובמכשירים לבישים ומעלה שאלות פרטיות והוגנות, היא מצביעה על עתיד שבו מורים יקבלו משוב בזמן אמת על מתי הסטודנטים ממוקדים, נלהבים או מתרחקים, ויוכלו להתאים פעילויות במקום במקום להמתין לסקרי סוף‑סמסטר.
ציטוט: Li, J. Predictive analysis of student engagement in university physical education courses based on a multimodal transformer algorithm. Sci Rep 16, 15123 (2026). https://doi.org/10.1038/s41598-026-45928-w
מילות מפתח: מעורבות סטודנטים, חינוך גופני, למידה מולטימודלית, מודל טרנספורמר, חיישנים לבישים