Clear Sky Science · ar
شبكة عصبية نابضة مستوحاة من علم الأعصاب وعلم النفس لتعلُّم وتأليف الموسيقى الغربية المشروطة بالنمط والدرجة
لماذا يهم تعليم الحواسيب على إدراك الدرجات
يمكن لمعظم الناس أن يشعروا عندما «تعود» أغنية إلى نغمتها النهائية، أو عندما يجعل وتر خاطئ كل شيء يبدو غير متماسك. ذلك الإحساس الغريزي يقوم على قواعد خفية للدرجة والنمط الموسيقي—الهيكل الصوتي الكامن تحت الموسيقى الغربية. يمكن للذكاء الاصطناعي الحديث أن يولّد ألحاناً لا نهائية، لكنه غالباً ما يتجاهل هذه القواعد أو يشفّرها بطريقة بدائية. يعرض هذا المقال نموذجاً جديداً مستوحى من الدماغ يتعلم الدرجات والأنماط الموسيقية بطريقة أقرب إلى المستمع البشري، ثم يستخدم هذه المعرفة لتأليف تناغم رباعي الأصوات. الهدف هو جعل آلات صناعة الموسيقى أكثر موسيقية وأوضح في عملها.
من الاستماع اليومي إلى خرائط داخلية للصوت
عند الاستماع إلى الموسيقى، يبني دماغك تدريجياً خريطة داخلية تبيّن أي النغمات تبدو مستقرة، وأيها تبدو متوترة، وكيف تتكشف الأنماط عادة. جسّد علماء النفس هذا من خلال نموذج كرومهانسل–شموكلر، الذي يقيس مدى انتماء كلٍ من الأصناف الاثني عشر للدرجة الموسيقية المعطاة. يربط علم الأعصاب هذا النوع من المعرفة النمطية بمناطق دماغية تنظم الخبرة عبر الزمن، مثل القشرة الجبهية الوسطى وبُنى الذاكرة كالحُصين. يجادل المؤلفون بأن معظم أنظمة التعلم العميق الموسيقية تتخطى هذه الأفكار النفسية والبيولوجية: فهي غالباً ما تُجبر كل القطع على الانضواء تحت درجة مرجعية أو تعامل الدرجة كوسم بسيط، وعملياتها الداخلية صعبة التفسير. بدلًا من ذلك، يسعى العمل الجديد إلى بناء شبكة يمكن مقارنة اتصالاتها الداخلية مباشرة مع الإدراك الطنيني البشري.

شبكة شبيهة بالدماغ تسمع المقامات والتسلسلات معاً
صمّم الباحثون شبكة عصبية نابضة، وهو نوع من النماذج يتواصل عبر نبضات كهربائية قصيرة، مراوِية للخلية العصبية الحقيقية. قسّموها إلى نظامين فرعيين رئيسيين. نظام «طنيني» يمثّل المقامات (الماجور والمينور) والـ24 درجة المستعملة في الموسيقى الغربية، مرتبة في تسلسل هرمي يذكّر بكيفية تخزين الدماغ للأنماط المجردة. نظام «الذاكرة التسلسلية» يحتفظ بالنوتات الفعلية لقطعة رباعية الأصوات—طبقاتها الصوتية ومددها—موزعة عبر تيارات منفصلة تمثل السوبرانو، الألتو، التينور والباس. داخل هذه التيارات، يُرمَز للارتفاع والمدة بمصفوفات من أعمدة صغيرة من الخلايا العصبية، مستوحاة بشكل فضفاض من تنظيم القشرة السمعية والخلايا الحساسة للزمن الموجودة في أبحاث التوقيت.
السماح للوصلات بالنمو مع الخبرة
بدلاً من توصيل كل شيء مسبقاً، يتيح النموذج تكوّن مشابك جديدة بين النظام الطنيني ونظام الذاكرة التسلسلية عندما تطلق الخلايا العصبية النار معاً بشكل متكرر أثناء عزف قطعة ما. هذا يُحاكي كيفية نشوء الدوائر العصبية وتغيرها خلال التعلم. وبمجرد وجود اتصال، تتعدل قوته بواسطة قاعدة تُدعى اللدونة المعتمدة على توقيت النبضات: إذا كانت عصبون المصدر يطلق عادةً قبل عصبون الهدف، يقوى الرابط؛ وإذا كان الترتيب معكوساً، يضعف. عبر كثير من القطع، بما في ذلك تمارين منهجية مصمَّمة لتسليط الضوء على أفكار هارمونية محددة ومجموعة كبيرة من كورالات يوهان سيباستيان باخ، تعكس الأسلاك الداخلية للشبكة تدريجياً أي النوتات تعمل كمحورية، داعمة أو نادرة في كل نمط ودرجة.

داخل إحساس الآلة بالدرجة
لاختبار ما إذا كان النموذج قد طور فعلاً توقعات طنينية شبيهة بالإنسان، قاس المؤلفون ميزتين في الاتصالات المتعلّمة: كم عدد المشابك التي جمعها كل صنف نغمي، ومدى قوة تلك المشابك في المتوسط. ثم قارنوا هذه الأنماط مع ملفات التعريف المعروفة نفسياً للدرجة. عبر كل من المقامات الكبيرة والصغيرة والدرجات الفردية العديدة، كان التطابق عالياً بشكل لافت. النغمات التي يسمعها البشر كنغمة «الوطن» أو النغمات الداعمة الرئيسية ظهرت أيضاً كأكثرها ارتباطاً داخل الشبكة. انعكست اختلافات دقيقة في مواد التدريب—فمثلاً، تمارين التعلم التي تشدّد أوتاراً معينة دفعت الشبكة لثقل تلك النغمات أكثر. وهذا يوحي بأن النموذج يلتقط قوانين طنينية عامة وعادات خاصة بالمجموعة المدربة، مثل التحشيد الثقافي البشري.
تأليف موسيقى جديدة في درجة مختارة
عند طلب التأليف، تُعطى للنظام نمط ودرجة مستهدفة، إضافة إلى وتر بداية قصير. ثم تُميِّل نشاطات الخلايا العصبية الخاصة بالدرجة نظام الذاكرة التسلسلية عبر الاتصالات المتعلّمة. تتنافس خلايا النوتات على الإطلاق، وتختار قاعدة بسيطة «الفائز يأخذ كل شيء» النغمة التالية في كل صوت. خطوة بخطوة، يولّد النموذج تناغمات رباعية جديدة تبقى ضمن الدرجة المقصودة مع استكشاف أشكال لحنية متنوعة. بالمقارنة مع مجموعة من نماذج التعلم العميق الشائعة—بما في ذلك الشبكات العودية، المحولات، ونماذج الانتشار—ينتج النموذج النابض قطعاً تكون نطاقات ارتفاعاتها، واستخدامها لنغمات السلم، وإحصاءاتها البنائية الأخرى أقرب إلى مجموعات البيانات المرجعية. وعلى وجه الخصوص، يحافظ على حصة عالية جداً من النوتات ضمن الدرجة دون أن يصبح رتيباً.
ما يعنيه هذا لآلات الموسيقى المستقبلية
للقارئ العام، النتيجة الأساسية هي أن شبكة مستوحاة من الدماغ يمكنها أن تتعلّم شيئاً مقارباً لإحساسنا الحدسي بالدرجة والسلم—وبإمكاننا رؤية تلك المعرفة مباشرة في توصيلاتها. النموذج لم يصل بعد إلى التعامل مع كل ثراء الموسيقى الحقيقية، مثل تغيّر الانسجام، تنوّع الإيقاع، أو التعبير التوقيتي. ومع ذلك، يقدّم جسراً ملموساً بين نظرية الموسيقى وعلم النفس والحساب العصبي. من خلال إظهار أن نظاماً ذا أساس بيولوجي يستطيع توليد تناغمات مقنعة وواعية بالدرجة وكشف كيفية وصوله لذلك، يشير هذا العمل نحو ذكاء اصطناعي موسيقي مستقبلي أكثر ثقافة موسيقية وأكثر شفافية في طريقة تفكيره حول الصوت.
الاستشهاد: Liang, Q., Zeng, Y. & Tang, M. A spiking neural network inspired by neuroscience and psychology for Western mode- and key-conditioned music learning and composition. Sci Rep 16, 12956 (2026). https://doi.org/10.1038/s41598-026-43529-1
الكلمات المفتاحية: الشبكات العصبية النابضة, توليد الموسيقى, الدرجة والنمط الموسيقي, إدراك الموسيقى الحاسوبي, الذكاء الاصطناعي المستلهم من الدماغ