Clear Sky Science · he
רשת עצבית דוקרת בהשראת מדעי המוח והפסיכולוגיה ללימוד ולחיבור מוזיקה מותאמת למוד ומפתח מערבי
מדוע חשוב ללמד מחשבים לזהות מפתחות
רוב האנשים מסוגלים לחוש מתי שיר "חזר הביתה" לתו הסופי שלו, או מתי אקורד שגוי גורם לכל השיר להישמע לא נכון. ההרגשה האינטואיטיבית הזו נשענת על כללים נסתרים של מפתח ומוד מוזיקליים — השלד הטונלי שמתחת למוזיקה מערבית. בינה מלאכותית מודרנית יכולה לייצר מנגינות בלי סוף, אך לעתים קרובות מתעלמת מכללים אלה או מקודדת אותם באופן גס. מאמר זה מציג מודל חדש בהשראת המוח הלומד מפתחות ומודים מוזיקליים בדומה לאופן שבו מאזין אנושי עושה זאת, ומשתמש בידע הזה לחיבור הרמוניות בארבע קולות. המטרה היא להפוך את מכונות יצירת המוזיקה לא רק ליותר מוזיקליות, אלא גם ליותר ברורות ונגישות להבנה.
מהשמיעה היומיומית למפות פנימיות של צליל
כשאתה מאזין למוזיקה, המוח שלך בונה בהדרגה מפה פנימית של אילו תווים מרגישים יציבים, אילו נשמעים מתוחים, ואיך דפוסים בדרך כלל מתפתחים. פסיכולוגים תיארו זאת באמצעות מודל קרומנשל–שמוקלר, שמודד עד כמה כל אחת מ-12 המחלקות הטונליות משתלבת במפתח נתון. מדעי המוח מקשרים ידע סכמטי מסוג זה לאזורים במוח שמארגנים חוויה לאורך זמן, כגון הקורטקס הפרה-מצחי המדיאלי ומבנים של זיכרון כמו ההיפוקמפוס. המחברים טוענים שרוב מערכות המוזיקה המבוססות למידה עמוקה מדלגות על התובנות הפסיכולוגיות והביולוגיות הללו: הן לעתים מכפות שכל היצירות יתאימו למפתח ייחוס או מתייחסות למפתח כתווית פשוטה, ועבודתן הפנימית קשה לפרש. העבודה החדשה במקום זאת שואפת לבנות רשת שיכולותיה הפנימיות ניתנות להשוואה ישירה לתפיסה הטונלית האנושית.

רשת דמוית מוח ששומעת גם סולמות וגם רצפים
החוקרים מעצבים רשת עצבית דוקרת, סוג של מודל שמתקשר באמצעות פולסים חשמליים קצרים, מהדהד את הניורונים האמיתיים. הם מחלקים אותה לשני תת־מערכות עיקריות. תת־מערכת "טונלית" מייצגת מודים (מייג'ור ומינור) ואת 24 המפתחות שבשימוש במוזיקה הטונלית המערבית, מסודרים בהיררכיה שמזכירה את האופן שבו המוח מאחסן סכמות מופשטות. תת־מערכת "זיכרון רצפי" מאחסנת את התווים בפועל של יצירה בארבעה קולות — גובהי הצליל ואורכן — מפוזרים בערוצים נפרדים המתאימים לסופראנו, אלטו, טנור ובס. בתוך ערוצים אלה, גובה ומשך מקודדים על ידי מערכים של עמודות נוירונים קטנות, בהשראה רופפת מארגון הקורטקס השמיעתי ותאים רגישי־זמן הנמצאים במחקרי תזמון.
לתת לקשרים לצמוח עם הניסיון
במקום לחבר הכל מראש, המודל מאפשר לסינפסות חדשות להיווצר בין תת־המערכת הטונלית ותת־המערכת של הזיכרון הרצפי כאשר נוירונים יורים יחד שוב ושוב בזמן שנגינת יצירה מוזנת למערכת. זה מדמה את האופן שבו מעגלים עצביים מופיעים ומשתנים במהלך הלמידה. ברגע שקשר קיים, חוזקו מותאם על ידי כלל שנקרא פלסטיות תלויית־תיזמון־הדק (STDP): אם נוירון מקור נוטה לירות מיד לפני נוירון מטרה, החיבור מתחזק; אם הסדר הופך, הוא נחלש. על פני יצירות רבות, כולל תרגילי ספר לימוד שנוצרו בקפידה כדי להדגיש רעיונות הרמוניים מסוימים ואוסף גדול של קוראלים של י.ס. באך, החיווט הפנימי של הרשת בהדרגה משקף אילו תווים פועלים כמרכזיים, תומכים או נדירים בכל מוד ומפתח.

בתוך תחושת המפתח של המכונה
כדי לבדוק האם המודל אכן פיתח ציפיות טונליות הדומות לאנושיות, המחברים מדדו שתי תכונות של החיבורים שנרכשו: כמה סינפסות צברה כל מחלקת גובה, ועד כמה חזקו אותן הסינפסות בממוצע. הם השוו את הדפוסים האלה לפרופילים המוכרים מתיאוריות פסיכולוגיות של מפתח. הן במודים מז'ור ומינור ובמפתחות בודדים רבים, ההתאמה הייתה גבוהה מאוד. תווים שאנשים שומעים כה"תו הביתי" או כתווים התומכים העיקריים גם הופיעו כחזקי החיבור ביותר ברשת. הבדלים עדינים שיקפו את חומרי האימון — למשל, תרגילים המדגישים אקורדים מסוימים דחפו את הרשת לתת משקל גבוה יותר לאותם תווים. הדבר מציע שהמודל תופס גם חוקים טונליים כלליים וגם הרגלי קורפוס ספציפיים, בדומה לאנצ'לטורציה אנושית.
לחבר מוזיקה חדשה במפתח שבחרו
כאשר מבקשים מהמערכת לחבר, היא מקבלת מוד ומפתח יעדיים, בנוסף לאקורד התחלתי קצר. הפעילות בתאי המפתח הספציפיים ואז משפיעה על תת־מערכת הזיכרון הרצפי דרך החיבורים שנלמדו. נוירונים מתחרים על התווים יורים, וכלל פשוט של "המנצח גובר" בוחר את התו הבא בכל קול. שלב אחרי שלב, המודל מייצר הרמוניות ארבע־קוליות חדשות שנשארות בתוך המפתח המיועד תוך כדי חקר צורות מלודיות משתנות. בהשוואה למגוון של מודלים פופולריים בלמידה עמוקה — כולל רשתות חוזרות, טרנספורמרים ומודלים של דיפוזיה — המודל הדוקר מייצר יצירות שטווחי הגובה שלהן, השימוש בתווי סולם וסטטיסטיקות מבניות אחרות דומות יותר למאגרי הייחוס. במיוחד, הוא שומר על אחוז גבוה מאוד של תווים בתוך המפתח מבלי להפוך למונוטוני.
מה זה אומר עבור מכונות מוזיקליות בעתיד
לקורא כללי, המסקנה המרכזית היא שרשת בהשראת המוח יכולה ללמוד משהו שקרוב לתחושתנו האינטואיטיבית של מפתח וסולם — ואנחנו יכולים לראות את הידע הזה ישירות בחיווט שלה. המודל עדיין לא מטפל בכל העושר של מוזיקה אמיתית, כמו הרמוניות מתחלפות, מגוון ריתמיקלי או טיימינג מפורש ומבעי. עם זאת, הוא מציע גשר מוחשי בין תיאוריית המוזיקה, הפסיכולוגיה והחישוב העצבני. בכך שהוא מראה שמערכת המונעת ביולוגית יכולה לייצר הרמוניות משכנעות המודעות למפתח ולחשוף כיצד הגיעו לכך, עבודה זו מצביעה על עתיד של בינה מוזיקלית שגם מבינה מוזיקה טוב יותר וגם שקופה יותר באופן שבו היא חושבת על צליל.
ציטוט: Liang, Q., Zeng, Y. & Tang, M. A spiking neural network inspired by neuroscience and psychology for Western mode- and key-conditioned music learning and composition. Sci Rep 16, 12956 (2026). https://doi.org/10.1038/s41598-026-43529-1
מילות מפתח: רשתות עצביות דוקרות, יצירת מוזיקה, מפתח ומוד מוזיקלי, קוגניציה מוזיקלית חישובית, בינה מלאכותית בהשראת המוח