Clear Sky Science · he

תוכנית חסימת מים קולית חסינת שינויים המשתמשת בטביעות אצבע מרובות תכונות ולמידת מכונה

· חזרה לאינדקס

מדוע סימנים חבויים בקול חשובים

כל יום שירים, פודקאסטים והקלטות מועתקים, מוזרמים ומשותפים ברחבי האינטרנט. הגישה הקלה הזו מצוינת למאזינים, אך מקשה על יוצרים וחברות להוכיח בעלות על החומר הקולי שלהם מבלי לפגוע בעצם האיכות של הצליל. המאמר המתואר כאן מציג שיטה חדשה ל״סימון״ קבצי קול כך שהבעלות ניתנת להוכחה גם לאחר עיבודים כבדים, תוך שמירה על הצליל המקורי ללא כל שינוי.

Figure 1
Figure 1.

הגנה על צליל בלי לגעת בו

חסימת מים דיגיטלית מסורתית פועלת קצת כמו חותם חלש שנלחץ לתמונה או לשיר: נתונים נוספים מוכנסים לקובץ המקורי. עם קול, אפילו שינויים זעירים עלולים ליצור ארטיפקטים שניתן לשמוע או להעלות בעיות משפטיות, במיוחד בהקלטות פורנזיות, רפואיות או ארכיוניות שצריכות להישאר טהורות. חסימת מים אפסית (zero-watermarking) נוקטת בגישה שונה. במקום לשנות את הצליל, היא בוחנת דפוסים ייחודיים שכבר קיימים באודיו ומשתמשת בהם לבניית ״טביעת אצבע״ השמורה במקום אחר. במקרה של מחלוקת, ניתן להשוות בין טביעת האצבע הזו להקלטה חשודה כדי לבדוק התאמה — בלי לערוך או לשכפל את האות המקורי.

להאזין לקול מכמה זוויות

המחברים מציעים מערכת חסימת מים אפסית שמאזינה לקול במספר דרכים משלימות במקביל. ראשית, הצליל נחצה לחלקים קצרים שאינם חופפים — פריימים. עבור כל פריים המערכת מודדת תשעה תכונות שונות שמתארות איך הצליל מתנהג לאורך זמן, כיצד האנרגיה שלו מתפזרת בין גווני תדר נמוכים וגבוהים, ואיך המבנה שלו נראה כאשר מטפלים בו כרשת של מדגמים קשורים. חלק מהתכונות משקפות שינויים מהירים, כמו פעימות פתאומיות או הופעות; אחרות תופסות היכן נמצאת רוב האנרגיה בספקטרום או עד כמה טווח התדרים רחב; ותכונות נוספות מתמצות לצורת האות הכללית במטריצות טרנספורמציה מתמטיות. יחד, המדידות האלה מציירות דיוקן עשיר של כל רגע באודיו.

ממדידות עשירות לטביעת אצבע יציבה

לא כל היבט של צליל שורד עיבודים כבדים באותה מידה. קימפול, סינון, שינוי תדירות דגימה ושינויים בזמן או בגובה הטון עלולים לעוות תכונות מסוימות אך להשאיר אחרות כמעט ללא שינוי. כדי להתמודד עם זה, השיטה מעריכה כיצד כל אחת מתשע התכונות מתנהגת תחת מגוון מתקפות מדומות. תכונות שנשארות יציבות מקבלות חשיבות גבוהה יותר, בעוד שתכונות שמשתנות מקבלות משקל נמוך יותר. עבור כל פריים התכונות המשוקללות משולבות לערך מורכב יחיד. השוואה מחליקה מול פריימים שכנים הופכת את העקבות הרציפות הללו לרצף של אפסים ואחדות, בדומה להפיכה של דפוס קול לברקוד. רצף הבינארי הזה משולב לאחר מכן עם סימן המים הרצוי (למשל לוגו קטן שהומר לביטים), ויוצר את טביעת האצבע הסופית שמקושרת באופן ייחודי ליצירה.

Figure 2
Figure 2.

ללמד מכונה לקרוא דרך הרעש

האתגר המרכזי הוא לשחזר את אותה טביעת אצבע לאחר שהאודיו עבר מתקפה — למשל הוספת רעש, קימפול ל-MP3, או שינוי קל במהירות הנגינה. לפתרון זה מאמנים מודל למידת מכונה מסוג Random Forest. במהלך האימון המערכת רואה דוגמאות רבות של אותם פריימים גם בצורה המקורית וגם לאחר עיוותים שונים, יחד עם התווית הבינארית הנכונה לכל פריים. ה-Random Forest לומד אילו שילובים של תכונות זמן, תדר ומבנה מקבילים ל-0 או ל-1. מאוחר יותר, כאשר בוחנים הקלטה חשודה, הפריימים שלה מעובדים באותו אופן והיער המאומן חוזה את הרצף הבינארי. על ידי שילוב הרצף החזוי הזה עם טביעת האצבע השמורה ניתן לשחזר את סימן המים המקורי ולהשוותו לאמיתי. המחברים גם מציגים נימוק מתמטי שמסביר מדוע הדגשת תכונות יציבות ושימוש בממיין מבוסס הצבעה עוזרים לשמור על שגיאות שיחזור נמוכות, גם תחת מתקפות חזקות.

כמה טוב השיטה עומדת במבחן

כדי לבחון את המערכת, החוקרים יישמו אותה על 100 קטעי מוזיקה ממגוון סגנונות וכן על דיבור וקולות סביבתיים ממאגרי נתונים ציבוריים ידועים. לאחר מכן חשפו את התכנים המסומנים למגוון רחב של פגיעות: הוספת רעשי רקע, סינון עובר-גבוה ועובר-נמוך, קימפול MP3, שינוי תדירות דגימה וקוונטיזציה מחדש, שינויים קטנים במהירות השמעה והסטות בפיץ׳. הם גם השתמשו בערכת מבחנים תובענית בשם Stirmark, שעוצבה במיוחד לאתגר שיטות חסימת מים. כמעט בכל התנאים, סימני המים שהושבו נחזו שונים ממקורם בפחות מארבעה אחוזים מהביטים, וציון הדמיון נשאר גבוה מאוד — משמעות הדבר היא שתבנית סימן המים שמרה על עצמה ברובה. בהשוואה למספר שיטות חסימת מים אפסיות מתקדמות אחרות, הגישה החדשה הציגה בדרך כלל עמידות שוות או טובה יותר, במיוחד בפני שינויים בזמן ובפיץ׳ מסובכים, תוך שהיא משאירה את האודיו נקי לחלוטין.

מה משמעות הדבר עבור האודיו היומיומי

במילים פשוטות, עבודה זו מראה שאפשר להוכיח בעלות על שיר או הקלטה מבלי לשנות אפילו דגימה אחת של הצליל. באמצעות שילוב קפדני של זוויות מבט רבות על אות האודיו ושימוש בלמידת מכונה לקרוא את העיוותים, השיטה מייצרת טביעת אצבע חסינת עיבודים נפוצים במציאות. זה הופך אותה לכלי מבטיח עבור חברות תקליטים, פלטפורמות סטרימינג, ארכיונים וכל סביבה שבה חשוב שהאודיו יישאר בלתי מעורב אך עדיין מוגן בצורה חזקה מפני שימוש לרעה.

ציטוט: Khaleel, D.I., Mosleh, M., Al-nidawi, W.J.A. et al. A robust audio zero watermarking scheme using multi feature fingerprints and machine learning. Sci Rep 16, 13504 (2026). https://doi.org/10.1038/s41598-026-40419-4

מילות מפתח: חסימת מים קולית, זכויות יוצרים דיגיטליות, למידת מכונה, עיבוד אותות, הגנת תוכן