Clear Sky Science · he

משחזורים של ויז'ן-טרנספורמרים - מודל סיווג סדקים על פני השטח מונחה-צרכן מבוסס רשתות קולמוגורוב–ארנולד

· חזרה לאינדקס

מדוע סדקים במבנים יומיומיים חשובים

סדקים בכבישים, בגשרים וקירות בניין עשויים להתחיל כסדקים שיעריים, אך עלולים להתפתח לסיכוני בטיחות משמעותיים ולעלויות תיקון גבוהות. כיום רוב הבדיקות עדיין נערכות על ידי אנשים עם לוחות ובדיקות ידניות או מצלמות — תהליך איטי, יקר ורגיש לטעויות, במיוחד כשמדובר בפגמים זעירים או מוסתרים. מאמר זה מציג שיטה ממוחשבת חדשה שמאתרת ומסווגת סדקים על פני בטון ואספלט בדיוק גבוה מאוד, תוך יעילות המאפשרת הפעלה על טלפונים, רחפנים ומכשירים קטנים אחרים. זה פותח אפשרות לניטור שוטף וזול של המבנים שבהם אנו משתמשים מדי יום.

מבדיקות ידניות למצלמות חכמות

בדיקה ויזואלית של משטחים סובלת ממגבלות ברורות: היא סובייקטיבית, גוזלת זמן ולעיתים מסוכנת עבור פקחים העובדים בכבישים עמוסים או על גשרים גבוהים. תוכניות ממוחשבות מוקדמות ניסו למצוא סדקים בתמונות באמצעות טריקים פשוטים כגון זיהוי קצוות וסף, אך התקשו עם צללים, תנודות בתאורה או מרקמים מחוספסים שיכולים להיראות כמו סדק. מערכות עדכניות יותר משתמשות בלמידת מכונה, שבה האלגוריתמים לומדים דפוסים מתוך מאגרי תמונות גדולים. רשתות קונבולוציה וטרנספורמרים חזותיים חדשניים הקפיצו את הדיוק כלפי מעלה, אך רבות מהשיטות עדיין מתקשות בטיפול בסדקים דקים ובלתי סדירים בתנאי שדה אמיתיים ולעיתים קשה להן להסביר את אופן קבלת ההחלטה.

Figure 1
Figure 1.

מודל היברידי של בינה מלאכותית שרואה בצורה ברורה יותר

המחברים עיצבו מודל למידה עמוקה היברידי שמשלב מספר חוזקות בצינור אחד. ראשית, רשת קומפקטית בשם MobileNet V3 סורקת את התמונה ומחלצת פרטים מקומיים כגון קצוות, מיקרו-סדקים ומרקם. לאחר מכן מודל טרנספורמר בשם LeViT מנתח כיצד חלקים שונים בתמונה קשורים זה לזה, ותופס דפוסים לטווח ארוך — למשל כיצד סדק צר מתפתל על פני לוח. רכיב שלישי, טרנספורמר משופר מסוג Linformer, מתמקד במודל יעיל של קשרים לטווח הארוך גם בתמונות ברזולוציה גבוהה, אך עם חישוב מופחת, כך שהדבר מעשי למכשירים קטנים.

מיזוג אותות וקבלת החלטה סופית

במקום פשוט לערום את המרכיבים הללו, המערכת משתמשת בצעד של "מיזוג תכונות מבוקר" (gated feature fusion) שלומד אילו חלקי מידע מכל רשת חשובים באמת ואילו מיותרים. זה עוזר למודל לשמר רמזים שימושיים על רוחב, אורך וממשות הסדק תוך התעלמות מתבניות רקע מבלבלות. האות הממוזג מועבר אז לרשת קולמוגורוב–ארנולד, סוג מיוחד של רשת עצבית המייצגת יחסים מורכבים באמצעות עקומות מתמטיות גמישות. הממיין הזה מכויל כדי לצייר גבול חד בין מקרים של "סדק" ל"אין סדק", גם כאשר הדפוסים בנתונים עדינים או מבולגנים, ועדיין נשאר מהיר וקומפקטי מספיק לשימוש בזמן אמת על חומרת קצה כמו סמארטפונים או לוחות מוטמעות.

Figure 2
Figure 2.

לפתוח את תיבת השחורה של ה-AI

מכיוון שבטיחות התשתיות תלויה באמון, המחברים גם מתמקדים בהבהרת החלטות המודל. הם מיישמים שני כלי הסבר — SHAP ו-LIME — כדי להדגיש אילו אזורים ומאפיינים בתמונה השפיעו ביותר על תחזית מסוימת. כאשר המודל מזהה סדק, כלים אלה ממקדים בדרך כלל את נתיב הסדק וסביבתו המיידית, מה שמאשר שהמערכת "מסתכלת" על המקומות הנכונים במקום להטעות על ידי כתמים או צללים. במהלך הפיתוח ההסברים חשפו גם חולשות, כמו נטייה להגיב לקווי צביעה על אספלט, מה שהוביל את הצוות להתאים את תהליך האימון ולהפחית אזעקות שווא.

עד כמה זה יעיל ולמה זה חשוב

נבדק על אוספים גדולים ומגוונים של תמונות בטון ואספלט — למעלה מ-40,000 תמונות ממספר מאגרי נתונים ציבוריים — המודל הגיע לדייקנות של כ-99.5% ושמר על ביצועים חזקים גם על תמונות חדשות שמעולם לא נחשף אליהן. הוא פעל גם עם פחות חישובים ופחות זיכרון מאשר גישות מתחרות רבות, מה שעושה אותו מתאים לשילוב במכשירי צרכנים, רחפנים ומערכות בדיקה בעלות נמוכה. משמעות הדבר היא שבעלי בתים, מנהלי מתקנים ומהנדסי עיר עשויים יום אחד להשתמש במצלמות חכמות רגילות או באפליקציות ניידות כדי לנטר משטחים ברציפות ולדווח על היווצרות סדקים מוקדמת, ולהפוך את הטיפול המבני מאירוע ידני נדיר למנגנון שוטף ומבוסס נתונים.

מבט לעתיד של מבנים בטוחים יותר

במונחים פשוטים, המחקר מראה כי שילוב מתוכנן בקפידה של רשתות קלות משקל, טרנספורמרים יעילים וממיין מתקדם יכול להבחין באופן אמין בין משטחים סדוקים לשלמים ולהסביר מדוע הגיע למסקנה זו. עדיין קיימים אתגרים פתוחים — כגון התמודדות עם תאורה קיצונית או מגבלות כוח קשות של המכשיר — אך העבודה מצביעה לעבר עתיד שבו מבנים, גשרים ומדרכות ינוטרו אוטומטית, ובכך ימנעו התפתחות של פגמים קטנים לכשלים מסוכנים.

ציטוט: Wahab Sait, A.R., Sankaranarayanan, S. & Yu, Y. Vision transformers- Kolmogorov–Arnold networks-based consumer driven surface cracks classification model. Sci Rep 16, 9183 (2026). https://doi.org/10.1038/s41598-026-40359-z

מילות מפתח: ניטור תשתיות, סדקי בטון, אספלט, למידה עמוקה, ראייה ממוחשבת