Clear Sky Science · he

YOLO‑Starfish: זיהוי עצמים של דגים הלומד תכונות תת‑מימיות מורכבות

· חזרה לאינדקס

מדוע קשה לזהות דגים מתחת למים

משינויי האקלים ועד דיג יתר — הבנת מה קורה מתחת לפני המים היא קריטית. מדענים ומנהלי משאבי דגה מסתמכים יותר ויותר על מצלמות תת‑מימיות כדי לספור ולזהות דגים, אך התמונות שהן אוספות לעתים קרובות עכורות, בגווני כחול‑ירוק ומלאות בעלי חיים החפופים זה לזה. סקירה ידנית של אלפי שעות וידאו איטית ורגישה לשגיאות. מאמר זה מציג את YOLO‑Starfish, מערכת בינה מלאכותית קומפקטית שנועדה לסייע לרובוטים ולמצלמות תת‑מימיות למצוא דגים באופן אוטומטי בתנאים קשים אלה, יחד עם מאגר תמונות חדש, עשיר בפרטים, של דגים במים מתוקים.

Figure 1
Figure 1.

העולם התת‑מימי בעיני המצלמה

זיהוי עצמים תת‑מימי אינו סתם ניתוח תמונות רגיל עם קצת מים. האור מתנהג אחרת בנהרות ובאגמים: אורכי גל אדומים נעלמים במהירות, חלקיקים מפזרים את האור לכיוונים רבים, והראות יכולה להשתנות מצלולה לעכורה בתוך מטרים ספורים. הדגים עצמם מוסיפים שכבה נוספת של קושי. מינים שונים עלולים להיראות דומים מאוד, דגים מאותו המין יכולים לנוע מגלגולים זעירים ועד בוגרים גדולים, והם לעתים קרובות חופפים, מתחבאים בין צמחיה או שוחים בתוך וביניי צללים. מגוון הגישות הקיימות של בינה מלאכותית אומנו על תמונות יחסית נקיות ומוארות היטב ולכן נדיר שראו סצנות כה מבולגנות — מה שמקשה עליהם כשמיישמים אותן בשטח.

בניית מאגר תמונות דגים ריאלי

כדי להתמודד עם הפער הזה, המחברים הרכיבו תחילה את Underwater Freshwater Fish Dataset (UFFD), אוסף גדול של תמונות תת‑מימיות מהעולם האמיתי. הם אספו קטעי וידאו ציבוריים מבתי גידול מים מתוקים מגוונים, חילצו פריימים אוטומטית במרווחים סדירים ואז בחרו ותייגו בקפידה תמונות איכותיות. במקום להתמקד בכמה מינים מפורסמים בלבד, הם החליטו לתייג כל דג שניתן לזהות, והסתכמו ב‑19 קטגוריות, כולל מחלקת "דג לא מזוהה" לפרטים שלא ניתן היה לזהות בוודאות. המאגר הסופי מכיל 18,594 תמונות (16,904 יחודיות), הכוללות טווח רחב של שקיפות מים, תנאי תאורה, מרחקי מצלמה וגדלי דגים. חשוב לציין שמספרי המינים מציגים דפוס "זנב ארוך": כמה מינים נפוצים בעוד רבים נדירים — בדומה לאקוסיסטמות אמיתיות.

Figure 2
Figure 2.

דרך חכמה לקרוא תמונות מפגעות

על בסיס מאגר זה בנו הצוות את YOLO‑Starfish, גרסה משופרת של גלאי ה‑YOLOv8 הפופולרי בזמן אמת. שתי רעיונות מרכזיים מניעים את השדרוג. ראשית, מודול C2Star משנה את אופן השילוב של התכונות הפנימיות ברשת. במקום פשוט לחבר דפוסים זה לזה, הוא כופל אותם איבר‑איבר במה שמכונה "פעולת כוכב". זה משקף כיצד האור מוחלש בפועל כשהוא עובר במים, שם האותות מושרטים בהרבה יותר מאשר רק שקועים ברעש. במובן מתמטי, הכפל מאפשר לרשת לייצג קומבינציות מורכבות יותר של צורות וצבעים מבלי להפוך למכבדת משקל — דבר חיוני לרובוטים תת‑מימיים הנשענים על סוללה ועם כוח חישוב מוגבל.

לתת לרשת להחליט מה באמת חשוב

החידוש השני, מודול שיפור מונחה‑קשב (ADEM), מתמקד באילו מידע מהימן בכל תמונה. משום שמים לעתים קרובות מושכים ערוצי צבע — במיוחד את האדום — הפרקטיקה הרגילה של מתן משקל שווה לכל ערוץ הצבע עלולה להטעות את הגלאי. ADEM מדחס את כל מידע ערוצי הצבע לערך הכוונתי יחיד שמעריך עד כמה הערוצים האלה מהימנים באופן כללי. הוא משלב אז רמז גלובלי זה עם קשב מרחבי שמדגיש אזורים ספציפיים בתמונה, באמצעות כלל פשוט של "לקח את המקסימום" במקום סכום פשוט. בסצנות שבהן רמזי צבע חזקים, המודל נשען יותר על מידע הערוצים; כשהצבעים נשטפים, הוא מסתמך יותר על תבניות מרחביות כמו צורות וקצוות. מפת הקשב הנוצרת משמשת לבסוף להגברת או לדיכוי תכונות ברחבי התמונה בצורה גמישה ומונחית נתונים.

כמה טוב YOLO‑Starfish עובד?

המחברים בדקו את YOLO‑Starfish בשלוש מערכת בדיקה: מאגר UFFD החדש שלהם, מאגר תת‑מימי קיים (RUOD), ואוסף השימושי כלל‑מטרה COCO2017. בכל שלוש המערכות, הוספת C2Star ו‑ADEM שיפרה את ציוני הזיהוי על פני ה‑YOLOv8 הבסיסי, לעיתים בכמה נקודות אחוז, תוך הפחתה קלה במספר הפרמטרים ובחישוב. הרווחים היו בולטים במיוחד במקרים קשים ב‑UFFD, כגון מיני "הזנב" הנדירים עם דוגמאות אימון מועטות וקטגוריית ה"דג לא מזוהה" הכללית, מה שמרמז על הכללה טובה יותר להופעות חדשות או עמומות. על COCO2017, YOLO‑Starfish גם החזיק מול דגמים קטנים מתקדמים אחרים, מה שמראה שהשיפורים שימושיים בהיקף רחב ואינם מוגבלים רק לדימויים תת‑מימיים.

מה המשמעות לצפייה במים

בעיקרו של דבר, המחקר מראה שעיצוב חכם של בינה מלאכותית יכול לגשר על הפער בין תמונות מעבדה נקיות לעולם המבולגן והמשתנה צבע מתחת לפני המים. בזיווג מאגר דגים במים מתוקים ריאלי עם עיבוד תכונות בהשראה פיזיקלית (C2Star) וקשב אדפטיבי (ADEM), YOLO‑Starfish מספק זיהוי דגים מדויק יותר בלי צורך בחומרה כבדה. עבור אקולוגים, מנהלי דגה ורובוטיקאים, כלי כזה עשוי להפוך ניטור ארוך‑טווח ובהיקף גדול של החיים המימיים לפרקטי הרבה יותר, ולהעניק מבט אוטומטי וברור יותר על המערכות האקולוגיות התת‑מימיות וכיצד הן משתנות עם הזמן.

ציטוט: Gong, R., Xu, J., Zheng, Z. et al. YOLO-Starfish: fish object detection learning complex underwater features. Sci Rep 16, 13964 (2026). https://doi.org/10.1038/s41598-026-44187-z

מילות מפתח: זיהוי דגים תת‑מימיים, ראייה ממוחשבת, למידה עמוקה, אקולוגיה מימית, ניטור רובוטי