Clear Sky Science · he
זיהוי אוטומטי של קולות בעלי חיים סטריאוטיפיים באמצעות הגדלת נתונים ולמידת העברה
להקשיב לקולות הנסתרים באוקיינוס
במעברי האוקיינוסים של העולם, מיקרופונים תת-מימיים עצומים מקליטים בשקט את הנוף הקולי: גלי שבירה, מנועי אוניות, קריסת קרח — ושירי לווייתנים עמוקים. בארכיונים אלה ניידים רמזים לגבי מקומות מגוריהם של בעלי חיים בסכנת הכחדה, מספרם וכיצד הם מסתגלים לעולם שמשתנה. עם זאת, פשוט יש יותר מדי אודיו מכדי שאנשים ימשו זאת בעין ובאוזן. מחקר זה מציג דרך חדשה לאמן "מקשיב" אוטומטי שיכול לזהות באופן אמין קריאות בעלי חיים מאוד סטריאוטיפיות — כגון שירי לווייתן כחול מסוימים — אפילו כאשר קיימת רק הקלטה טובה אחת של הקריאה.

מדוע קשה למצוא קולות בעלי חיים
מדענים מסתמכים יותר ויותר על ניטור אקוסטי פסיבי: משאירים מקליטים בטבע ולאחר מכן סורקים את האודיו כדי למצוא קריאות בעלי חיים. עבור מינים נפוצים או רועשים, מערכות למידה עמוקה מודרניות פועלות היטב, אך הן דורשות אלפי דוגמאות מתוייגות ומחשוב חזק. זו בעיה משמעותית עבור בעלי חיים נדירים או חמקמקים שקלוט קריאותיהם התרחש רק מספר מועט של פעמים, וכמו כן עבור קבוצות מחקר שאין להן גישה למחסני מחשוב גדולים. בנוסף לכך, הקלטות באוקיינוס רועשות ומורכבות — רעשי רקע מסערות, קרח ואוניות יכולים לטבוע קריאות, ומומחים אנושיים עצמם רבים פעמים אינם מסכימים אילו סימנים חלשים בספקטרוגרמה שייכים באמת ללווייתן.
לבנות מארג אימון גדול כמעט מאפס
המחברים התמקדו בבעלי חיים המפיקים קריאות שחוזרות על עצמן מאוד, או "סטריאוטיפיות" — שבהן כל פרט מייצר כמעט את אותו צליל. הם פיתחו צינור אימון חצי-סינתטי שמתחיל מרק דוגמה טובה אחת או כמה דוגמאות נקיות של קריאה יעד ואז יוצר אלפי וריאציות ריאליסטיות. באמצעות עיבוד אודיו סטנדרטי, המערכת מתיחה או דחיסה קלה של הקריאה בזמן, משנה את גובהה כדי לחקות שינויים ארוכי-טווח בשיר, מוסיפה עיוותים והדים עדינים, ומערבבת אותה עם רעשי רקע אמיתיים מהים. מהותי לכך, כל השינויים מבוססים על התנהגות ידועה של לווייתנים והעברת קול במים, כך שהקריאות הסינתטיות עדיין נראות ונשמעות כאילו יכלו להיווצר על ידי לווייתן אמיתי.
מיחזור רשת נוירונית קיימת
במקום לאמן גלאי מאפס, הצוות השתמש בלמידת העברה: הם התחילו מרשת נוירונית שתוכננה במקור לזיהוי דיבור אנושי ועדכנו אותה לשירי לווייתנים. רשת זו מטפלת בקול כסדרה של "מסגרות" ספקטרוגרמה קצרות ומחוברות חופפות וכוללת שכבות חוזרות שיכולות לעקוב אחר דפוסים לאורך זמן, מה שמאפשר לה להתמודד עם קריאות באורכים שונים. האימון נעשה על חומרה צרכנית — מחשב נייד סטנדרטי עם כרטיס גרפי צנוע — והושלם בכשעתיים-חמש בערך. לאחר האימון, המערכת יכלה לסרוק ארבע שעות של אודיו ימי בכחצי עד שתי דקות, כולל כל העיבוד המקדים והעיבוד שלאחר מכן.
להעמיד את הגלאי למבחן
השיטה הוערכה על שתי קריאות תדירות נמוכה מאוד ושונות אחת מהשנייה של לווייתנים כחולים בסכנת הכחדה: ה"Z-call" הפשוט ויורד של לווייתנים כחולים אנטארקטיים והשיר המורכב והרב-חלקי של לווייתני פיגמי של צ'אגוס באוקיינוס ההודי. בשני המקרים, הגלאי אומן כולו על נתונים חצי-סינתטיים. עבור אחד המודלים, אוסף האימון נבנה מרק דוגמה אמיתית יחידה של שיר צ'אגוס. כדי לשפוט באופן הוגן את הביצועים, המחברים לא הסתמכו בעיוורון על יומני "אמת קרקע" קיימים, שהתבררו כמכילים קריאות רבות שנפספסו. במקום זאת, אנליסט מנוסה עבר ידנית על אלפי מקרים של אי-הסכמות בין הגלאי ליומנים. לאחר הבדיקה הזו, מודל צ'אגוס הטוב מצא נכונה 99.4% מהקריאות המטרה עם דיוק של 91.2%, בעוד שמודל אנטארקטי מצא 87% עם דיוק של 65% לפי ניקוד כוללני שחשב גם קריאות ברורות וגם מקהלות צפופות.

מה המשמעות של התוצאות לשימור
לגולש שאינו מומחה, המספרים האלה משמעותם שהגלאי יכול לסרוק ארכיונים עצומים ולסמן באופן אמין כמעט את כל ההתרחשויות של שיר לווייתן נתון, עם יחסית מעט אזעקות שווא, אפילו כשהוא אומן מתוך הקלטה טובה יחידה. זו קפיצת מדרגה חשובה במחקר מינים מעטים-מידע או מאוימים שלרוב לא מצליחים להיתפס קולית. הכותבים מתריעים שההצלחה תלויה בבחירות ברורות לגבי מה נחשב "מוצלח" — למשל, האם לכלול מקהלות חופפות — ובתכנון קפדני של דוגמאות אימון חיוביות ושליליות. הם גם מדגישים שאפילו תיוגים של מומחים אנושיים אינם מושלמים, ודרושים תקנים טובים יותר להערכה. עם זאת, מסגרת זו מראה שעם הגדלת נתונים חכמה ולמידת העברה, ניתן לבנות כלי הקשבה חזקים לשימור בזול ולשתף אותם בחופשיות, ובכך לעזור למדע לפתוח את הקולות הנסתרים שכבר מאוחסנים בארכיוני הקול העולמיים שלנו.
ציטוט: Jancovich, B.A., Sanchez, V., Truong, G. et al. Automated detection of stereotyped animal sounds using data augmentation and transfer learning. Sci Rep 16, 13137 (2026). https://doi.org/10.1038/s41598-026-48308-6
מילות מפתח: ניטור אקוסטי פסיבי, שירי לווייתן כחול, גלאי למידה עמוקה, נתוני אימון סינתטיים, שימור חיות בר