Clear Sky Science · he
M6: מאגרי גילוי מוזיקה שנוצרה על ידי מכונה — רב־יוצר, רב־דומיין, רב־לשוני ותרבותי, רב־ז'אנרים, רב־כלים
מדוע עליית המוזיקה שנוצרה על ידי בינה מלאכותית חשובה
פלטפורמות הזרמת המוזיקה מתמלאות בשקט בשירים שאינם נכתבים על ידי בני אדם, אלא על ידי אלגוריתמים. פסי הקול הללו שנוצרו על ידי מכונה יכולים לשמש ככלים מועילים לטיפול, לפסקולים לקולנוע או לפלייליסטים יומיומיים, אך הם מטשטשים גם את הגבול בין יצירה אנושית לייצור אוטומטי. המאמר הזה מציג את M6, אוסף מוזיקה חדש ונרחב שנבנה כדי לסייע לחוקרים להבחין בין מוזיקה שנוצרה על ידי בני אדם לזו שנוצרה על ידי בינה מלאכותית, ולנתח מה מייחד כל אחד מהם. מטרתו לתמוך בהענקת קרדיט הוגן לאמנים תוך שמירה על תפקיד בונה ל-AI ביצירת מוזיקה.
בניית מגרש מבחן מוזיקלי רחב
המחברים טוענים שהתקדמות בזיהוי מוזיקה שנוצרה על ידי AI נחסמה בגלל חוסר בנתונים מתאימים. מאגרים קיימים או מתמקדים במשימות אחרות, כמו התאמת מוזיקה לתיאורי טקסט, או מכסים רק חתך צר של סגנונות מוזיקליים. M6 נועדה למלא את הפער הזה. היא משלבת אלפי רצועות שנוצרו על ידי בני אדם עם אלפי רצועות שנוצרו על ידי מספר מערכות AI שונות, באריזת קבצי שמע סטנדרטית. המאגר רחב במכוון: הוא מקיף כלים רבים, שפות, תרבויות, ז'אנרים, אורכי שירים ושירים עם שירה לצד קטעים אינסטרומנטליים. המגוון העשיר מאפשר למדענים לבדוק האם שיטות הגילוי עובדות בסביבות מוזיקליות מציאותיות שמשתנות תדיר.

איסוף שירים מאנשים וממכונות
כדי להרכיב את צד האנושיים של M6, הצוות התבסס על אוספים פתוחים ידועים כמו GTZAN (לז'אנרי מוזיקה), Free Music Archive, COSIAN (מוזיקה ווקאלית יפנית), ומאגר של צלילי כלי נגינה בודדים. הם גם דגמו שירים נוספים מפלטפורמות הזרמה כאשר הרישיונות אפשרו זאת, ובחרו קליפים שמציגים בבירור את הרעיון המוזיקלי הראשי ולא רק קטעי מעבר קצרים. בצד המכונה, הם יצרו מוזיקה חדשה באמצעות כמה ממערכות המצב־האמיתי, כולל מודלים מחקריים פתוחים וכלים מסחריים. פקודות מעוצבות בקפידה, חלקן נוצרו על ידי מודל שפה, ביקשו מהמערכות ליצור מוזיקה בסגנונות, קצבים או עם כלים מסוימים, כך שרצועות ה‑AI ישקפו את מגוון המוזיקה האנושית.
בדיקת איכות וזיהוי הבדלים דקים
מכיוון ששיפוט איכות מוזיקלית הוא סובייקטיבי, המחברים שילבו דעות מאזינים עם מדידות אובייקטיביות. הם חישבו תיאורים מספריים פשוטים לכל רצועה, שתיארו היבטים כגון מורכבות הקצב, טווח המלודי, בהירות ספקטרום הצליל וכמות האנרגיה האקוסטית. בממוצע, יצירות שנוצרו על ידי AI נבדלו מאלה של בני האדם במדדים הללו — לדוגמה, לעתים היה להן טווח גובה צליל צרים במעט או אנרגיה כללית נמוכה יותר — אך ההבדלים היו קטנים מספיק שרוב המאזינים לא היו שמים לב ללא השוואה מדוקדקת. במבחני האזנה עם 50 מתנדבים, אנשים זיהו נכונה האם קליפ נוצר על ידי אדם או על ידי AI רק בכ־50% מהמקרים, משמעותית לא טוב יותר מהגרלת מטבע. זה מרמז שמוזיקת AI כבר הגיעה לרמת גימור שיכולה להטעות מאזינים שאינם מקצועיים.
בחינת שיטות הגילוי
עם M6 בידיהם, החוקרים העריכו מגוון מודלים ממוחשבים כדי לראות עד כמה הם מצליחים לגלות מוזיקה שנוצרה על ידי AI. הם בחנו למידת מכונה קלאסית, רשתות נוירונים בסגנון תמונה שעובדות על ספקטרוגרמות, מודלים טרנספורמריים ומערכות אודיו מודרניות שבמקור נבנו לזיהוי דיבור מזויף. כאשר המודלים הוכשרו ונבחנו על סוגים דומים של מוזיקה, כמה מהם השיגו דיוק גבוה, במיוחד רשתות קונבולוציה שמתמקדות בתבניות בתמונה זמן–תדר של הצליל. עם זאת, הביצועים ירדו בחדות כשהמודלים נתקלו במוזיקה "מחוץ לדומיין" — סגנונות, שפות או גנרטורים שלא נחשפו להם קודם. המחקר גם חשף שמערכות מוזיקה שונות של AI משאירות "טביעות אקוסטיות" מובחנות, מה שהופך גנרטורים מסוימים לקלים לזיהוי יותר מאחרים ומעלה חשש שמגלים יתאמנו יתר על המידה על כלים מסוימים במקום על התכונות העמוקות של מוזיקה שנוצרה על ידי מכונה.

מה המשמעות של זה עבור מוזיקה ו‑AI
פרויקט M6 מראה שבה בעת שמחשבים יכולים לעיתים קרובות לציין במדויק מוזיקה שנוצרה על ידי AI בהקשרים מוכרים, גילוי אמין בשטח נשאר אתגר מרכזי. מאזינים אנושיים כבר מתקשים להבחין, והאלגוריתמים הנוכחיים מתקשים כאשר המוזיקה משתנה בז'אנר, בשפה, באורך או בשיטת היצירה. בהנפקת מאגר גדול, מגוון וזמין בפומבי, המחברים מקווים לעודד פיתוח כלים אמינים ושקופים יותר לגילוי. כלים כאלה יכולים לשמור על אמון בפלטפורמות מוזיקה דיגיטליות, לתמוך בהכרה הוגנת של אמנים אנושיים, ולהנחות מערכות AI עתידיות לכיוון שיתוף פעולה עם מוזיקאים במקום החלפה שקטה.
ציטוט: Li, Y., Li, H., Specia, L. et al. M6: multi-generator, multi-domain, multi-lingual and cultural, multi-genres, multi-instrument machine-generated music detection databases. Sci Rep 16, 9237 (2026). https://doi.org/10.1038/s41598-026-36044-w
מילות מפתח: מוזיקה שנוצרה על ידי בינה מלאכותית, אודיו מזויף (דיפפייק), גילוי מוזיקה, למידת מכונה, יצירה דיגיטלית