Clear Sky Science · he

רשת שיתופית בעלת תשומת-לב מרובה לזיהוי עצמים קטנים בזמן אמת בתמונות רחפנים

· חזרה לאינדקס

למה חשוב לזהות פרטים זעירים מהשמיים

ככל שדרונים הופכים לכלי שגרתי למעקב תנועה, תגובה לאסונות וביטחון, הם חייבים לזהות באופן מהימן עצמים קטנים—כמו רכבים, אופניים או אנשים—הנראים ממבט גבוה. בתצפיות אוויריות אלה, המטרות תופסות רק כמה פיקסלים, וקל לאבדן בצללים, בסינוור וברקע עמוס. מאמר זה מציג מערכת ראייה ממוחשבת חדשה, שנקראת רשת שיתופית בעלת תשומת-לב מרובה (CMA-Net), שנועדה לאתר עצמים קטנים כאלה בתמונות רחפנים במהירות ובדיוק המתאימים לשימוש בזמן אמת.

האתגרים בזיהוי פריטים קטנים ממעל

זיהוי עצמים קטנים בתמונות רחפן קשה יותר מאשר בתמונות רחוב רגילות. משום שדרונים עפים גבוה וצופים בסצינות מזוויות רבות, רכבים ואנשים נראים זעירים ומטושטשים, ותנאי התאורה עלולים להשתנות במהירות. מגלאים מסורתיים בשני שלבים יכולים להיות מדויקים מאוד אך לעיתים איטיים מדי לשימוש בזמן אמת בפלטפורמות מעופפות בעלות כוח חישוב ורוחב פס מוגבלים. שיטות חד-שלב מהירות פועלות בזמן אמת אך נוטות להחמיץ מטרות קטנות כי הפרטים שלהן דועכים ככל שהתמונה עוברת שכבה אחרי שכבה. המחברים טוענים כי זיהוי טוב יותר של עצמים קטנים דורש דרכים חכמות יותר לשילוב מידע על קנה מידה שונה ולהעברת תשומת-לב חישובית לחלקים המידע-עשירים בתמונה.

Figure 1
Figure 1.

בניית סולם תכונות חכם יותר

CMA-Net מתחילה משלד לעיבוד תמונה נפוץ, ResNet-50, ואז מוסיפה רשת פירמידה דו-כיוונית יעילה (E-BiFPN). מבנה זה בונה מעין סולם של מפות תכונה בגדלים שונים, ומאפשר למערכת לערבב פרטים מדויקים משכבות מוקדמות עם הקשר מופשט יותר משכבות עמוקות. בשונה מעיצובים קודמים, E-BiFPN מקצרת שכבות גבוהות לא נחוצות ומוסיפה בלוק עיבוד קל משקל מיוחד המשתמש בקונבולוציות חלקיות כדי להפחית חישוב. סכמת מיזוג משוקללת לומדת לאחר מכן כמה יש לסמוך על תכונות רדודות מול עמוקות בכל קנה מידה, כך שמידע עדין על רכבים או הולכי רגל מועלה בעוד הרעש מהרקע מוקטן.

ללמד את הרשת לאן להסתכל

מעבר לארגון מחדש של תכונות, CMA-Net משתמשת במנגנוני תשומת-לב המחקים איך בני אדם מתמקדים בחלקים רלוונטיים בסצנה. מודול תשומת-לב ערוצי דו-ממדי (DDCA) מנתח תכונות בנפרד לאורך רוחב וגובה התמונה, במקום לדחוס את הכול לסיכום גלובלי יחיד. העיצוב הזה עוזר לרשת ללכוד דפוסים לטווח ארוך הן בכיוונאים האופקי והן האנכי, ושומר רמזי מיקום שחיוניים כאשר עצמים קטנים מתמזגים ברקע מורכב. במקביל, מודול תשומת-לב חזיתית בריבוי קנה-מידה (MSFA) קושר עצמים גדולים וקל לזיהוי בשכבות העמוקות לאובייקטים קטנים יותר בשכבות הרדודות. על-ידי דגימה ומיזוג מידע משלושה קני-מידה, MSFA לומד להדגיש אזורי חזית שבהם סביר למצוא רכבים ולהדחיק מרקמים רקע מבלבלים.

Figure 2
Figure 2.

מתכונות משופרות להחלטות מהירות

פלטי ענפי ה-DDCA וה-MSFA מאוחדים למפות תכונה עשירות המתאימות לעצמים קטנים, ומועברים לראש גילוי "ללא עוגנים". במקום להסתמך על רשת צפופה של תיבות קבועות מראש, הראש הזה חוזה ישירות גם את הקטגוריה וגם את מיקום העצמים, מה שמפשט חישובים והופך את האימון לגמיש יותר. המחברים בדקו את CMA-Net על שני מאגרי נתונים ציבוריים תובעניים של רחפנים, UAVDT ו-Stanford Drone, הכוללים דרכים צפופות, תנאי מזג אוויר משתנים ותנאי יום–לילה. CMA-Net השיגה דיוק של 67.2% ו-62.0% במאגרים אלה תוך ריצה בקצב של 64 פריימים לשנייה, כלומר היא יכולה לעבד וידאו בזמן אמת תוך שהיא עולה על רבים מהגלאים הפופולריים, כולל חלק ממשפחת YOLO ודגמים מורכבים יותר המבוססים על טרנספורמרים.

מה זה אומר לשימוש רחפנים במציאות

עבור הציבור הרחב, המסקנה המרכזית היא ש-CMA-Net משפר משמעותית את יכולת הרחפן לזהות עצמים קטנים וקשים לראות מבלי להאט אותו. על-ידי מיזוג זהיר של מידע על מספר קני-מידה והנחיית תשומת-לב של הרשת הן בין ערוצי התמונה והן בין חזית לרקע, השיטה מונעת התעלמות מרכבים ואנשים זעירים. שילוב זה של דיוק ומהירות הופך את הגישה למבטיחה ליישומים מעשיים כגון מעקב תנועה חכם, תצפית על קהל ותגובה לחירום, שם החמצת עצם קטן או תגובה איטית מדי עלולות להיות בעלות תוצאות חמורות.

ציטוט: Yang, J., Yue, X. & Wu, L. A collaborative multi-attention network for real-time small object detection in UAV imagery. Sci Rep 16, 5852 (2026). https://doi.org/10.1038/s41598-026-36440-2

מילות מפתח: חזון רחפן, זיהוי עצמים קטנים, פיקוח בזמן אמת, רשתות תשומת-לב, מעקב תנועה