Clear Sky Science · he

שילוב קונבולוציות רב־קנה מידה ומנגנוני תשומת לב ב‑HybridHAR לזיהוי פעילות אנושית־ביצועים גבוהים

2026-02-21 · חזרה לאינדקס

מדוע ללמד מחשבים תנועות יומיומיות חשוב

כל יום הטלפונים, השעונים והגאדג'טים שלנו מקליטים בשקט איך אנחנו נעים — האם אנחנו הולכים, עולים במדרגות או נחים על הספה. המרת אותות התנועה הגולמיים הללו להבנה מאמינה של פעילות אנושית יכולה לשנות את תחומי ניטור הבריאות, טיפול בקשישים, שיקום ובתים חכמים. מאמר זה מציג את HybridHAR, מודל מחשב חדש שנועד לקרוא את האותות הללו בצורה מדויקת ויעילה יותר, ולקרב אותנו למכשירים לבישים שמבינים באמת מה אנחנו עושים בזמן אמת.

הבנת פעילות מתוך חיישני תנועה

זיהוי פעילות אנושית הוא המשימה של הבנת מה אדם עושה על סמך חיישנים כמו מואצים וג'יירו בתוך סמארטפונים ומכשירים לבישים. מערכות מוקדמות התבססו על מומחים שעיצבו תכונות מהאותות הללו והזינו אותן לאלגוריתמי למידת מכונה מסורתיים. גישה זו עבדה במעבדה מבוקרת אך לעתים קרובות קרסה בעולם האמיתי המיוער והרועש, שבו התנועות מגוונות ורועשות יותר. למידה עמוקה שיפרה את המצב על ידי גילוי דפוסים בנתונים באופן אוטומטי, אך עיצובים נפוצים עדיין מפספסים פרטים חשובים שמתרחשים בטווחי זמן שונים ועשויים לאבד מידע ככל שהרשתות מתעמקות.

מדוע מודלים עמוקים קיימים עדיין נאבקים

תנועות אנושיות מתרחשות במקביל על מספר טווחי זמן: צעד מהיר, הליכה קצרה דרך החדר או פרק זמן ארוך של ישיבה. מודלי למידה עמוקה רבים מתמקדים או בחלקים קצרים או בטווחים ארוכים, אך לא בשניהם בצורה שווה. כאשר מוסיפים עוד שכבות כדי ללכוד דפוסים מורכבים, עלולות להופיע דעיכויות באיתותי הלמידה שגורמות לשכבות מוקדמות להפסיק להשתפר. חלק מהמודלים חסרים גם הדרכה לשכבות הפנימיות שלהם, ולכן אינן לומדות את הבלוקים התיכון־רמה החשובים לזיהוי פעילויות שנראות דומות באותות הגולמיים, כגון ישיבה לעומת עמידה.

עיצוב היברידי שמתבונן בתנועה בכמה אופנים

המחברים מציעים את HybridHAR, מודל מהונדס בקפידה המתמודד עם חולשות אלו באמצעות שלוש רעיונות מרכזיים שעובדים ביחד. ראשית, במקום להשתמש במבט יחיד על הזמן, הוא מעביר את אותו אות חיישן דרך שלוש מסלולי עיבוד מקביליים שכל אחד מביט בטווחי זמן שונים — מקטעים מאוד קצרים ועד מקטעים ארוכים יותר. מסלולים אלה פועלים כמו שלשת עדשות, ותופסים פרטים עדינים של מחוות מהירות וגם מגמות איטיות יותר בעמידה ותנועה. הפלטים שלהם מאוחדים לייצוג משולב ועשיר ששומר על מידע מכל הקנה־מידות הללו.

תשומת לב והנחיית למידה עמוק בתוך המודל

שנית, HybridHAR מוסיף מודול תשומת לב מיוחד מעל הייצוג המשולב הזה. מנגנון זה לומד להדגיש את החלקים המדויקים ביותר של האות — למשל, ההבדלים הקלים בתנועה שמבדילים עלייה במדרגות מירידה במדרגות — תוך כדי שמירה על נתיב קיצור ששומר על המידע המקורי. קיצור "הרזידואלי" הזה מסייע לאיתותי הלמידה לזרום בצורה חלקה דרך הרשת, ומונע שטיפת מידע בשכבות העמוקות יותר. שלישית, למודל ניתן מסווג עזר שנגזר מתכונות ביניים לפני החלת התשומת לב. במהלך האימון גם פלט עזר זה מדורג, וכך מניע בעדינות שכבות מוקדמות ללמוד תכונות שכבר מספיק טובות להניב ניחושים על פעילויות — מה שמייצב ומאיץ את הלמידה.

כמה טוב השיטה החדשה מתפקדת

לבחינת HybridHAR החוקרים השתמשו במאגר ציבורי מקובל שבו מתנדבים נשאו סמארטפון בעת ביצוע שישה פעילויות בסיסיות: שלושה סוגי הליכה וכן ישיבה, עמידה ושכיבה. בבנצ'מרק זה HybridHAR הגיע לכמת דיוק של כ‑99% על נתוני אימות שהוחזקו הצידה וכ‑96% על מערך בדיקה שלא נצפה, והכי מדויק מול מספר חלופות חזקות, כולל רשתות קונבולוציה קלאסיות, רשתות רציפות, מודלים היברידיים ושיטות מבוססות חיזוק. המודל הראה חוזק מיוחד בהבחנה בין פעילויות הליכה דומות והקטין טעויות בין זוגות מבלבלים כמו עלייה וירידה במדרגות. הצוות גם הראה שכל אחת משלושת המרכיבים — מסלולים רב־קנה־מידתיים, תשומת לב והשגחה עמוקה — שיפרה תוצאות באופן מדיד, וששילוב מלא השיג ביצועים טובים יותר מכל וריאנט שחסר אחד מהם.

מדוע זה חשוב למכשירים בעולם האמיתי

למרות הדיוק הגבוה, HybridHAR נותר קומפקטי ומהיר, עם הרבה פחות פרמטרים להתאמה מאשר הרבה מודלים מתחרים ועם היכולת לעבד מאות חלונות פעילות בשנייה תוך שימוש בכ‑megabyte אחד של זיכרון בקירוב. הוא גם הכליל היטב למאגר שני, מורכב יותר, עם פעילויות מרובות והגדרות חיישנים עשירות יותר, שם ביצע אפילו טוב יותר. עבור לא־מומחים, המסקנה המרכזית היא שעיצוב זה מציג מתווה מעשי להמרת אותות לבישים רעשים לתיאורים אמינים ומדויקים של מה אנשים עושים. מודלים כאלה יכולים להפוך בעתיד את מערכת ניטור הבריאות, הבתים החכמים ומערכות הבטיחות לאמינות יותר ולקלות יותר להפעלה במכשירים יומיומיים.

ציטוט: Huo, Y., Wei, C., Xu, Z. et al. Integrating multi-scale convolution and attention mechanisms in HybridHAR for high-performance human activity recognition. Sci Rep 16, 10143 (2026). https://doi.org/10.1038/s41598-026-40904-w

מילות מפתח: זיהוי פעילות אנושית, חיישנים לבישים, למידה עמוקה, מנגנוני תשומת לב, ניטור בריאות