Clear Sky Science · he

MFR-YOLO: קידום זיהוי עצמים בכלי טיס בלתי מאוישים באמצעות שיפור תכונות רב-קניוני בעזרת קונבולוציה מתעקמת ותשומת לב גלובלית

· חזרה לאינדקס

למה ראיית רחפנים חדה חשובה

מניטורינג תנועה ועד חיפוש והצלה לאחר אסון — רחפנים הופכים לעיניים מעופפות עבור הערים והשדות שלנו. עם זאת, זיהוי מכוניות או אנשים קטנים ומהירים מלמעלה קשה בהרבה משנראה. מחקר זה מציג את MFR-YOLO, שיטה משופרת שמאפשרת לרחפנים לזהות בזמן אמת רבים מהעצמים הקטנים והמעוותים, ועוזרת למערכות אוויריות לקבל החלטות בטוחות וחכמות יותר.

האתגר של ראייה מהשמיים

מצלמות רחפן מצלמות רחובות צפופים, חוות או אזורי אסון שבהם רוב המטרות תופסות רק מספר פיקסלים בודדים. העצמים משתנים במהירות בגודל ובזווית ככל שהרחפן נע, ובניינים, עצים וצללים מתמזגים עם מה שאנו רוצים לזהות. מערכות זיהוי סטנדרטיות לעתים קרובות מפספסות מטרות זעירות אלו, מבלבלות אותן עם הרקע או מאטות כשמנסים לשפר את הדיוק. משפחת המודלים הפופולרית YOLO מאזנת כבר בין מהירות לדיוק, אך בלוקים בנייה הרגילים שלה עדיין מאבדים פרטים עדינים, מתקשים עם צורות מוטות או מתוחות וחסרים כלים חזקים להתעלם מסצנות מבולגנות.

Figure 1. כיצד רחפנים ממירים מבטים אוויריים צפופים למפות ברורות יותר של מכוניות ואנשים זעירים בזמן אמת.
Figure 1. כיצד רחפנים ממירים מבטים אוויריים צפופים למפות ברורות יותר של מכוניות ואנשים זעירים בזמן אמת.

דרך חדשה לשימור פרטים זעירים

המחברים בונים על YOLOv12 ומעצבים את MFR-YOLO לשמר פרטים קטנים תוך שמירה על מהירות. ראשית, הם מוסיפים מודול חילוץ תכונות רב-קניוני שפועל בשני מסלולים במקביל. מסלול אחד מתמקד בשימור קצוות ומרקמים חדים כדי שאנשים, אופניים ומכוניות לא ייעלמו כשהתמונות מצומצמות ברשת. המסלול השני משתמש במסננים גמישים שיכולים "להתעקם" במיקומי הדגימה שלהם, ובכך להתאים טוב יותר לעצמים שמופיעים סובבים, מתוחים או מקווצלים בגלל מבט הרחפן המשתנה. מיזוג המסלולים הללו מייצר מפות עשירות יותר שעדיין נושאות את המידע העדין הנדרש לזיהוי מטרות זעירות מאוד.

להראות למודל מה באמת חשוב

כדי למנוע מהרשת להתבדר בשמיים, עצים או בניינים, הצוות משתיל מודול תשומת לב גלובלית בשלב בניית התכונות ובשלב מיזוג התכונות. מודול זה לומד להדגיש אזורים ודפוסים השייכים למטרות סבירות תוך שהכהיית אזורים לא רלוונטיים. חלק אחד מביט על כל התמונה להדגשת מיקומים חשובים, כמו שורות רכבים או קבוצות הולכי רגל. חלק אחר מתאים את עוצמתם של סוגי דפוסים שונים, כך שערוצים המתארים קצוות ומרקמים שימושיים מועצמים בעוד שערוצים רעשיים מיחרשים. יחד שלבי תשומת הלב הללו עוזרים למודל למקד את המאמצים שלו בעצמים אמיתיים במקום באי סדר של הרקע.

Figure 2. כיצד שכבות מעודנות ותשומת לב מסייעות למערכת הראייה של הרחפן להפריד ולחדד אובייקטים זעירים רבים שלב אחרי שלב.
Figure 2. כיצד שכבות מעודנות ותשומת לב מסייעות למערכת הראייה של הרחפן להפריד ולחדד אובייקטים זעירים רבים שלב אחרי שלב.

שילוב רמזים מקרוב וממרחב רחב

מעבר לשיפורים בודדים, MFR-YOLO גם משפרת את אופן מיזוג המידע בקנה מידה שונה. בלוק תכונות משודרג, הנקרא C3K2-PPA, מפצל את המידע לשלושה סניפים. אחד מתמקד בפרטים מקומיים זעירים, אחר מביט בחתיכות רחבות יותר של הסצנה, ושלישי מקשר ביניהם דרך רצף קצר של פעולות. הרשת לומדת לאחר מכן כמה משקל לתת לכל סניף עבור תמונה נתונה, וממזגת אותם חזרה בעזרת קישור קיצור לשמירה על יציבות הלמידה. העיצוב הזה מאפשר למערכת להבין גם עצמים קטנים וגם את ההקשר הרחב שסביבם, דבר קריטי כאשר רכבים או אנשים רבים חופפים או מוסתרים חלקית.

כמה טוב השיטה החדשה עובדת

החוקרים בדקו את MFR-YOLO על שני מערכי נתונים ציבוריים מרחפנים: VisDrone2021, המכסה רחובות עירוניים עמוסים ותנאי מזג אוויר מגוונים, ו-UA-DETRAC, המתמקד בתנועת כלי רכב. בהשוואה למספר גלאים ידועים כולל Faster R CNN, RetinaNet, גרסאות YOLO עדכניות ומודלים מבוססי טרנספורמר, MFR-YOLO השיגה דיוק כולל גבוה יותר, ובאופן חשוב גילתה הרבה יותר עצמים זעירים תוך כדי פספוס פחותי מטרות. כל זאת תוך שמירה על מהירות עיבוד הגבוהה מהרמה הנדרשת לשימוש בזמן אמת על חומרת הרחפן המוטמעת הממוצעת, וללא דרישה להגדלה משמעותית בזיכרון או בחישוב.

מה זה אומר לשימוש יומיומי ברחפנים

בעבור קהל לא מומחה, המסר המרכזי הוא ש-MFR-YOLO מסייעת לרחפנים לראות עצמים קטנים וצפופים בצורה ברורה ומהירה יותר בסצנות אמיתיות ומגוונות. על ידי עיצוב מחדש של הדרך שבה המערכת שומרת על פרטים, מתאימה לצורות מעוותות, מתמקדת בתשומת לב וממזגת מבטים מקומיים וגלובליים, המחברים משפרים את איכות הזיהוי מבלי לוותר על מהירות. זה עושה את הכלים המבוססים על רחפנים לאמינים יותר למטרות בטיחות תנועה, ניטור חקלאי ותגובה לשעת חירום, ומספק תבנית להתאמת מודלים חזותיים לסביבות תובעניות אחרות.

ציטוט: Ge, J., Lv, H., Guo, Y. et al. MFR-YOLO: advancing UAV object detection with multi-scale feature refinement via deformable convolution and global attention. Sci Rep 16, 15587 (2026). https://doi.org/10.1038/s41598-026-45641-8

מילות מפתח: זיהוי עצמים ב-UAV, זיהוי עצמים זעירים, YOLO, תמונות רחפן, ראייה ממוחשבת