Clear Sky Science · he

אלגוריתם לזיהוי תמונה עבור חלקי עבודה מדויקים בתדירות גבוהה המבוסס על ארכיטקטורת רשת רב‑סעיפית

· חזרה לאינדקס

עיניים חכמות יותר לחלקי מפעל

מפעלים מודרניים מסתמכים על מצלמות ומחשבים כדי למיין אלפי חלקי מתכת כמעט זהים בקצב גבוה. כאשר ההבדלים בין החלקים הם רק בפרטים זעירים על פני השטח, גם תוכנות זיהוי תמונה מתקדמות עלולות להתבלבל, מה שמוביל לפריטים מעורבבים שגויים, עיכובים בייצור ועלויות נוספות. מחקר זה מציג שיטה חדשה שבה מכונות "רואות" ומבדילות בין רכיבים דומים כאלה, בהבטחה לייצור אוטומטי אמין, גמיש ויעיל יותר.

מדוע קשה להבחין בחלקים דומים

בפיוסי ייצור רבים, מה שנקרא חלקי עבודה בתדירות גבוהה—חלקי מתכת שטוחים המיוצרים בכמויות גדולות—נדרשים למיון לעשרות קטגוריות. הקושי הוא שחלקים מאותה קטגוריה יכולים להציג מרקמים משטח מורכבים, בעוד שחלקים מקטגוריות שונות עשויים להיראות כמעט זהים ממעל. שינויים בתאורה ושונות במיקום החלק מול המצלמה מקשים עוד יותר את הבעיה. סוג משימה זה הוא דוגמה למה שמדעני המחשב מכנים זיהוי עדין: לא רק להבדיל בין רכב לאדם, אלא להבחין בין שני חלקים מאוד דומים בהתבסס על רמזים עדינים.

Figure 1
Figure 1.

גישה דו‑מסלולית לבחינת כל חלק

החוקרים בונים על רשת עצבית קומפקטית הידועה כ‑EfficientNet‑B0 והופכים אותה למערכת רב‑סעיפית שהם קוראים לה MBEN. במקום להזין לרשת רק את התמונה המלאה של החלק, הם נותנים למודל קודם כל לזהות בערך איזה אזור בתמונה נושא את המידע המבדיל ביותר. מודול זיהוי אזורים חלש‑מופחת מבוקר יוצר מעין מפה חום שמדגישה אזורים מועמדים, ולאחר מכן חותכת חתיכת תמונה קטנה סביב האזור הזה. התמונה המלאה עוברת בסעיף אחד של הרשת (הסעיף הגלובלי), בעוד התקריב החתוך עובר בסעיף אחר (הסעיף המקומי). עיצוב זה מאפשר למערכת ללמוד גם את המראה הכולל וגם את ההבדלים המקומיים הקטנטנים שמבדילים בין סוגי חלקים.

להדריך את המודל לגבי מה שבאמת חשוב

מתן שתי נקודות מבט לבדו אינו מספיק; יש ללמד את הרשת להתמקד בהבחנות הנכונות. לשם כך כותבי המאמר מעצבים מודול העשרת פונקציית הפסד—חוקים שמדריכים כיצד הרשת מתאמת את עצמה במהלך האימון. חלק במודול זה גורם למערכת לשים תשומת לב מיוחדת לקטגוריות שהיא מתקשה להבחין ביניהן כרגע, כדי שלא תהפוך לבטוחה יתר על המידה במקרים קלים ותזניח את המקרים הקשים. חלק אחר מעודד תמונות מאותו סוג חלק להצטבר קרוב זו לזו במרחב הייצוג הפנימי של הרשת, תוך דחיפה של סוגים שונים זה מזה. יחד, מנגנונים אלו יוצרים מפת ייצוג פנימית ברורה יותר של הקטגוריות, ומשפרים את הסיכויים שתמונות חדשות ובלתי‑נראות יסווגו נכונה.

Figure 2
Figure 2.

מיזוג התמונה הרחבה עם התקריב

לאחר שסעיף הגלובלי והסעיף המקומי מייצרים כל אחד את הניבויים שלהם, מודול מיזוג הסעיפים משלב אותם להחלטה סופית. החוקרים מווסתים כמה כל סעיף יתרום, ומוצאים כי מתן משקל מעט גבוה יותר לתמונה הגלובלית תוך אמון חזק עדיין באזור התקריב עובד הכי טוב. הם בודקים את שורתם על מאגר נתונים מותאם של 20 סוגי חלקים בתדירות גבוהה שצולמו תחת תאורת מפעל ריאליסטית, עם אלפי תמונות שהורחבו בעזרת טריקים של הגדלת נתונים כמו סיבובים וגזירות אקראיות. מערכת ה‑MBEN משיגה דיוק של 98.75%—כמה נקודות אחוז יותר ממגוון שיטות זיהוי עדין קיימות—בעוד שהיא משתמשת במשאבי חישוב יחסית צנועים.

מה משמעות הדבר עבור ייצור במציאות

המחקר מדגים כי שילוב של הקשר התמונה בשלמותו, חתכי פרטים שמתגלה באופן אוטומטי, וחוקי אימון מתוכננים בקפידה יכולים להפוך את חזון המחשב לאמינו יותר במשימות תעשייתיות קשות. עבור יצרנים, שיפורים כאלה עשויים להתבטא בפחות שגיאות מיון, פחות בדיקה ידנית וגמישות רבה יותר במעבר בין סוגי מוצרים דומים רבים. אף על פי שהעבודה עדיין לא מטפלת בנתונים לא מאוזנים מן העולם האמיתי, שבהם חלקים מסוימים נדירים בהרבה מאחרים, התוצאות מרמזות שעיניים דיגיטליות חכמות ובחירתיות יותר יכולות לעמוד בקצב קווי ייצור מדויקים ומגוונים יותר.

ציטוט: Deng, J., Sun, C., Lin, J. et al. An image recognition agorithm for fine-grained high-frequency workpieces based on a multi-branch network architecture. Sci Rep 16, 11067 (2026). https://doi.org/10.1038/s41598-026-41639-4

מילות מפתח: זיהוי תמונות תעשייתי, מיון עדין (סיווג דטי̆לני), בקרת איכות אוטומטית, חזון ממוחשב בייצור, רשתות עצביות