Clear Sky Science · he
שילוב Swin-T מפושט עם EFS-Net מותאם עבור סגמנטציה מונחית-קשב של צינורות תת-מימיים בסביבות ימיות מורכבות
מדוע חשוב לעקוב אחר קרקעית הים
מוסתרות מתחת לגלים, רשתות עצומות של צינורות נשאות נפט, גז וכבלי חשמל שעליהם מסתמכות החברה המודרנית. אם צינורות תת-מימיים נשברים, מתחמקים מקורוזיה או זזים ממקומם, התוצאה עלולה להיות עצירות יקרות וזיהום חמור. היום, רוב עבודת הבדיקה מבוצעת על ידי מפעילים אנושיים שצופים בשעות של וידיאו עכור מרובוטים תת-מימיים. מאמר זה מציג מערכת בינה מלאכותית חדשה היכולה לזהות באופן אוטומטי צינורות מתמונות תת-מימיות קשות, אפילו כשהן עמומות, מלאות ב"שלג ימי" או חצובות בחול. צעד זה לקראת בדיקה אוטומטית אמינה עלול להפוך את תחזוקת התשתיות והאנרגיה הימית לבטוחה וזולה יותר.

לראות בבירור בעולם עכור
דימות תת-מימי קשה במיוחד לפרשנות מחשבית. האור יורד במהירות עם העומק, הצבעים נוטים לכחול-ירוק, וחלקיקים צפים יוצרים אובך וכתמים דמויי-שלג. שיטות תמונה קלאסיות, התלויות בקצוות חדים וניגודיות נקייה, נוטות להיכשל כשצינור מכוסה בחול, מוסתר על ידי צמחיה או מטושטש בערפל. למידת מכונה עמוקה שיפרה את המצב, וכמה רשתות פופולריות כבר יכולות לזהות צינורות במערכות נתונים ספציפיות. עם זאת, מערכות אלה בדרך כלל מתמחות בתנאי מים או בהגדרות מצלמה מסוימות. כשהן מתמודדות עם סביבה חדשה — מים, תאורה או רקע שונים — הדיוק שלהן יורד בחדות. האתגר המרכזי הוא לבנות מודל שהוא גם מדויק וגמיש וגם יעיל מספיק כדי לפעול במערכות בדיקה בשטח.
גישה בעלת שני "מוחות" לתמונות תת-מימיות
המחברים פותרים זאת על ידי בניית ארכיטקטורת בינה מלאכותית היברידית שממזגת שתי "דרכי ראייה" שונות מאוד. ענף אחד, מבוסס על גרסה מצומצמת של Swin Transformer, פועל כמו מצפה בזווית רחבה. הוא סורק את הפריים כולו כדי להבין דפוסים בקנה מידה גדול, כגון נתיב כללי של צינור על קרקעית הים. הענף השני, מותאם ממודל בשם EFS-Net ומונע על ידי גב EfficientNet, מתנהג כמו זכוכית מגדלת. הוא מתרכז בפרטים המוקד: קצוות, מרקמים ומבנים דקים שמגלים היכן מתחיל הצינור והיכן מסתיים החול או הצמחייה. שני הענפים מעבדים את אותן תמונות שקוצרו וממירים אותן למפות תכונה פנימיות המתארות מה הרשת סבורה שעשוי להיות מבנה מובהק בכל אזור של התמונה.
לתת ל'קשב' להחליט מה חשוב
הצמדה פשוטה של תוצרי שני הענפים תיצור סבך של מידע מיותר. במקום זאת, המודל משתמש במנגנון "קשב" שמחליט, פיקסל אחרי פיקסל, אילו פרטים שווים התמקדות. מודול תשומת-לב חוצה בעל שלושה ראשים משווה בין התכונות מענף המוקד לפרטים לבין התכונות מענף ההקשר הגלובלי. במהותו, ענף הפרטים שואל שאלות ממוקדות — "האם קצה זה הוא חלק מצינור?" — בעוד ענף ההקשר מספק רמזים גלובליים — "האם קו במיקום ובכיוון זה הגיוני כחלק מצינור?" שלב ייעול נוסף, הנקרא CBAM, מחזק עוד יותר את האות מאזורים סבירים של צינור ומיכך רעשי רקע כמו סלעים, אצות או חלקיקים תלויים. רשת מפענחת אחר כך בהדרגה מסכה בגודל מלא שמסמנת כל פיקסל כצינור או לא.

להעמיד את המערכת במבחן
כדי לשפוט האם העיצוב הזה עובד בפועל, החוקרים אספו מאגר נתונים גדול ותובעני בשם HOMOMO. הוא מכיל מעל 120,000 תמונות צבע של צינורות קרקעית אמיתיים שצולמו לאורך 1.2 קילומטר של צינור בתנאים משתנים ולעתים עוינים: אור נמוך, ערפל ימי, "שלג" צף, סחף חול וצמיחה צמחית כבדה. הם אימנו את המודל על חלק מהאוסף ואז השוו אותו למערכות נפוצות כמו UNet, DeepLab, SwinUNet, TransUNet, Mask2Former וכמה גרסאות של המאבחן האובייקטים YOLO. על HOMOMO, המודל ההיברידי שלהם ביצע סגמנטציה נכונה של פיקסלי צינור עם משקל ממוצע של חפיפה (mean intersection-over-union) של כ-98%, גבוה משמעותית מהשיטה המתחרה הטובה ביותר. ובאותו מידה חשובה, כשנבדק — ללא אימון מחדש — על שני מקורות תמונה שונים מאוד, מאגר Roboflow סינתטי וקטעי YouTube מהעולם האמיתי, המודל עדיין הציג ביצועים חזקים, מה שמראה שהוא יכול להתמודד עם מצלמות ותנאי מים חדשים.
מה זה אומר לאוקיינוס האמיתי
לא-מומחים, המסקנה היא שמערכת בינה מלאכותית זו יכולה לתחום באופן אמין צינורות תת-מימיים במסגרת פריימים של וידיאו שמונוים ורחבים מדי לשיטות קונבנציונליות. באמצעות שילוב מבט גלובלי על הסצנה עם עין חדה לפרטים וקצוות, ובהתשת על קשב לאיחוד נקודות המבט הללו, המודל משיג דיוק גבוה מבלי לדרוש כוח מחשוב עצום. במונחים מעשיים, כלי כזה יכול לסייע לרובוטים אוטונומיים לנטר ברציפות קטעים ארוכים של תשתיות תת-ימיות ולסמן נזקים או קבורות אפשריות לסקירת מומחה אנושי. בעוד שהוא עדיין מתקשה עם צינורות דקים מאוד או כאלה המוסתרים לחלוטין, הגישה מהווה צעד חשוב לעבר בדיקה בטוחה ומאוטומטת יותר של ה"צנרת" המוסתרת שתומכת ברשתות האנרגיה והתקשורת המודרניות.
ציטוט: Hosseini, N., Mohanna, F. & Moghimi, M.K. Integrating simplified Swin-T with modified EFS-Net for attention-guided underwater pipelines segmentation in complex underwater environments. Sci Rep 16, 6987 (2026). https://doi.org/10.1038/s41598-026-38081-x
מילות מפתח: צינורות תת-מימיים, סגמנטציה של תמונה, למידה עמוקה, בדיקות ימיות, רשתות טרנספורמר