Clear Sky Science · he
Faster R-CNN מסתגל תחומית לזיהוי חוסר ציוד מיגון אישי באתרי בנייה מתמונות שלמצו על הגוף וממצלמות כלליות
מדוע חוסר בציוד עדיין חומק בין הסורקים
קסדות, אפודי־נראות, מסכות, כפפות ונעליים עמידות אמורים להיות חובת יסוד באתרי בנייה, אך הליקויים עדיין מתרחשים—ולעתים הם גוררים סיכון מוות. פרויקטים רבים מסתמכים כיום על מצלמות ובינה מלאכותית כדי לזהות עובדים חסרי ציוד נדרש, אך מערכות אלו נאבקות כיוון שההפרות האמיתיות נדירות וקשה ללכוד אותן בצילומים. המאמר חוקר דרך לאמן מערכות זיהוי חכמות יותר על‑ידי השאלת דוגמאות מתמונות רחוב רגילות, מה שעשוי להפוך בדיקות בטיחות אוטומטיות לאמינות יותר מבלי להמתין לתאונות או להצטברות הפרות.
להפוך תמונות יומיומיות לשיעורי בטיחות
הרעיון המרכזי פשוט: אנשים במקומות ציבוריים או במשרדים לעיתים רחוקות לובשים ציוד בנייה, ולכן תמונות מהסביבות האלה מלאות בדוגמאות של "מה לא ללבוש" באתר עבודות. האתגר הוא שהסצנות האלו נראות שונה מאוד מבחינה חזותית מסביבת עבודה אמיתית—רקעים, תאורה וזוויות צילום משנים את האופן שבו אנשים מופיעים. המחבר מתייחס לעולמות אלה כתחומים שונים: תחום מקור עם שפע דוגמאות של חוסר PPE מתמונות כלליות, ותחום יעד עם תמונות פחותות אך ריאליסטיות יותר מאתרי בנייה, רבות מהן מצולמות במצלמות המותקנות על קסדות העובדים. המאמר מראה שביישור זהיר של מה שהמחשב לומד משני התחומים, המערכת יכולה לזהות חוסר ציוד באתרים אמיתיים בצורה מדויקת הרבה יותר מאשר אם הייתה מאומנת רק על נתוני בנייה.

איך הבודק החדש רואה את הסצנה
המחקר בונה על מערכת זיהוי עצמים פופולרית שנקראת Faster R‑CNN, אשר סורקת תמונה, מציעה אזורים שסבירים להכיל אנשים או חלקי גוף, ואז מקטלגת מה שנמצא בתוך כל תיבה. כאן, הגלאי מאומן לזהות חמישה סוגי חוסר ציוד: ללא קסדה, ללא מסכה, ללא כפפה, ללא אפוד ובלי נעליים בטיחותיות. לפני שהאימוּנות מוזנות למודל, הן עוברים הגברות משמעותיות—הבהרה או להכהה, סיבוב, טשטוש ועיוות—כדי לחקות מצלמות רועדות, שמש חזקה וזוויות לא נוחות הנפוצות באתרים פעילים. המגוון הסינתטי הזה מסייע למודל להישאר יציב כאשר הצילומים מהעולם האמיתי לא מושלמים, כפי שקורה לעיתים קרובות במצלמות הנמצאות על הגוף.
ללמד את המערכת להתעלם מהרקע
פשוט לערבב תמונות רחוב עם צילומי בנייה אינו מספיק; המודל עלול ללמוד לקשר בין חוסר ציוד למדרכות עירוניות במקום לאנשים עצמם. כדי למנוע זאת, המחקר מציג מודולים של "התאמה בין תחומים" שנועדים לדחוף בעדינות את המערכת להתמקד באנשים ובבגדים במקום בסצנה שמסביב. מודול אחד מסתכל על התמונה בכללותה, ומטה את הרשת כך שתמונות בנייה ולא בנייה יניבו דפוסים כלליים דומים, למרות הבדלים בתאורה או בציוד. מודול נוסף פועל ברמת כל אדם שזוהה, ומוודא כי החתימה הוויזואלית של דוגמה חסרת הגנה בראש, למשל, תיראה דומה בין אם היא מופיעה על פיגום או ברחוב קניות. מודולים אלה מאומנים באופן אוונרסיאלי: מסווג קטן מנסה לנחש מאיזה תחום הגיעה התמונה, בעוד הרשת הראשית לומדת להסתיר את המידע הזה ולהישאר ממוקדת בציוד המגן.

בדיקת השיטה
המחבר הרכיב מאגר נתונים משמעותי על‑ידי שילוב קטעי וידאו ממצלמות על הגוף מחמישה אתרי בנייה בדרום קוריאה עם מספר אוספי תמונות ציבוריים. לאחר תיוג ידני של כל מקרה של חוסר קסדה, מסכה, כפפה, אפוד ונעליים בטיחותיות, המחקר אימן מאות מודלים עם גבות רשתות נוירונים ופרמטרים שונים. המופע הטוב ביותר השתמש ברשת עמוקה שנקראת ResNet‑152 יחד עם הגברה חזקה של תמונה ומודולי התאמה בין תחומים. על תמונות בנייה שלא נראו קודם לכן, הקונפיגורציה הזו השיגה mean Average Precision—ציון כולל לאיכות הזיהוי—בכ‑86.8 אחוזים בערך, ובאותו זמן פעלה בקצב של כ‑33 פריימים לשנייה, מהיר מספיק לניטור כמעט בזמן אמת. בהשוואה למערכות מונחיות קונבנציונליות, המודל המתואם שיפר את הדיוק בעד 14 נקודות אחוז, ועד כ‑39 נקודות לעומת בסיס פשוט יותר.
מה המשמעות לאתרים בטוחים יותר
ללא‑מומחים, המסר הוא שאימון חכם יותר, לא רק מאגרי נתונים גדולים יותר, יכול להפוך ניטור בטיחות אוטומטי למהימן יותר. על‑ידי למידה מתמונות יומיומיות ומאתרי עבודה אמיתיים, וכחלק מלימוד המערכת להתעלם מפרטים רקע לא חשובים, הגישה המוצעת מזהה בחוזקה חוסר קסדות, אפודים, כפפות, מסכות ונעליים בטיחותיות—אפילו כאשר הפרות אמיתיות נדירות. בעוד שהעבודה הנוכחית מתמקדת בחמישה סוגי ציוד ובמאגר בנייה עיקרי אחד, היא מציעה מתווה מעשי למערכות עתידיות שיכולות לעקוב אחר רתמות, חבלים וציוד בטיחות אחר במספר אתרים, ולסייע למפקחים לתפוס בעיות מוקדם ולשמור על בטיחות העובדים בלי לשבת ולצפות במסכי וידאו כל היום.
ציטוט: Wang, S. Domain-adaptive faster R-CNN for non-PPE identification on construction sites from body-worn and general images. Sci Rep 16, 4793 (2026). https://doi.org/10.1038/s41598-026-35148-7
מילות מפתח: בטיחות באתרי בנייה, ציוד מיגון אישי, חזון ממוחשב, התאמה בין תחומים, זיהוי עצמים