Clear Sky Science · ar

M6: قواعد بيانات اكتشاف الموسيقى المُولَّدة آلياً متعددة المولِّدين، متعددة المجالات، متعددة اللغات والثقافات، متعددة الأنواع، ومتعددة الآلات

· العودة إلى الفهرس

لماذا صعود الموسيقى المصنوعة بواسطة الذكاء الاصطناعي مهم

منصات بث الموسيقى تمتلئ بهدوء بأغنيات لم تُكتب بواسطة بشر بل بواسطة خوارزميات. قد تكون هذه المقاطع المولَّدة آلياً أدوات مفيدة للعلاج، وموسيقى الأفلام، أو قوائم التشغيل اليومية، لكنها في الوقت نفسه تُغيم الفاصل بين الإبداع البشري والإنتاج الآلي. تقدم هذه الورقة M6، مجموعة موسيقية جديدة وكبيرة بُنيت لمساعدة الباحثين على التمييز بين الموسيقى البشرية والمولَّدة آلياً، وفهم ما الذي يميزهما عن بعضهما. هدفها هو دعم منح الاعتماد العادل للفنانين مع السماح في الوقت ذاته للذكاء الاصطناعي بلعب دور بنّاء في صناعة الموسيقى.

بناء بيئة اختبار موسيقية كبيرة

يجادل المؤلفون بأن التقدم في كشف الموسيقى المولَّدة آلياً عُوقِب بنقص بيانات مناسبة. المجموعات الموجودة إما تركز على مهام أخرى، مثل مطابقة الموسيقى مع أوصاف نصية، أو تغطي شريحة ضيقة فقط من الأساليب الموسيقية. تم تصميم M6 لردم هذه الفجوة. يجمع بين آلاف المقاطع التي صنعها بشر وآلاف أخرى أنتجتها عدة أنظمة ذكاء اصطناعي مختلفة، معبأة بصيغة صوتية معيارية. المجموعة واسعة عمداً: تمتد عبر العديد من الآلات واللغات والثقافات والأنواع، وأطوال الأغاني، وتشمل الأغاني الغنائية والقطع الآلية الخلفية. تتيح هذه التنوعات الغنية للعلماء اختبار ما إذا كانت أساليب الكشف تعمل في سياقات موسيقية واقعية ومتغيرة باستمرار.

Figure 1
Figure 1.

جمع الأغاني من البشر والآلات

لجمع الجانب البشري في M6، استند الفريق إلى مجموعات مفتوحة معروفة مثل GTZAN (لأنواع الموسيقى)، وFree Music Archive، وCOSIAN (الموسيقى الغنائية اليابانية)، ومجموعة بيانات لأصوات الآلات الفردية. كما أخذوا عينات إضافية من منصات البث عندما سمحت التراخيص، مختارين مقاطع تُبرز الفكرة الموسيقية الرئيسية بوضوح بدلاً من فواصل قصيرة فقط. على الجانب الآلي، ولَّدوا موسيقى جديدة باستخدام عدة أنظمة متقدمة، بما في ذلك نماذج بحثية مفتوحة وأدوات تجارية. طلبت مطالبات مصممة بعناية، وبعضها أنتجته نموذج لغوي، من هذه الأنظمة أن تبتكر موسيقى بأساليب أو إيقاعات معينة أو باستخدام آلات محددة، بحيث تعكس المقاطع الآلية تنوع الموسيقى البشرية.

التحقق من الجودة واكتشاف الفروق الدقيقة

بما أن أحكام جودة الموسيقى مسألة ذاتية، جمع المؤلفون آراء المستمعين مع قياسات موضوعية. حسبوا واصفات رقمية بسيطة لكل مقطع، تلتقط جوانب مثل مدى تعقيد الإيقاعات، ومدى اتساع النطاق اللحنى، ومدى سطوع طيف الصوت، ومقدار الطاقة في الإشارة. في المتوسط، اختلفت القطع المولَّدة آلياً عن البشرية في هذه المقاييس — على سبيل المثال، غالباً ما كانت تملك نطاقات نغمية أضيق قليلاً أو طاقة إجمالية أقل — لكن الفروق كانت صغيرة بما يكفي لدرجة أن معظم المستمعين لن يلاحظوها دون مقارنة دقيقة. في اختبارات استماع بمشاركة 50 متطوعاً، حدَّد الناس ما إذا كان المقطع بشرياً أم مولَّداً آلياً بشكل صحيح في حوالي نصف الحالات فقط، أي لا أفضل عملياً من رمية عملة. يشير ذلك إلى أن موسيقى الذكاء الاصطناعي قد وصلت بالفعل إلى مستوى من الصقل الذي يمكن أن يضلل المستمعين العاديين بسهولة.

اختبار أساليب الكشف

مع وجود M6، قيَّم الباحثون مجموعة متنوعة من النماذج الحاسوبية لمعرفة مدى قدرتها على كشف الموسيقى المولَّدة آلياً. جربوا تعلم الآلة الكلاسيكي، وشبكات عصبية على نمط الصور تعالج الطيف الترددي، ونماذج المحوِّلات، وأنظمة صوتية حديثة بُنيت أصلاً لاكتشاف الكلام المزيف. عندما تم تدريب النماذج واختبارها على أنواع موسيقية مشابهة، حقق بعضها دقة عالية، خاصة الشبكات التلافيفية التي تركز على الأنماط في صورة الزمن–التردد للصوت. ومع ذلك، تراجع الأداء بشدة عندما واجهت النماذج موسيقى «خارج المجال» — أنماط أو لغات أو مولِّدات لم ترها من قبل. كشفت الدراسة أيضاً أن أنظمة الموسيقى الآلية المختلفة تترك «بصمات» صوتية مميزة، مما يجعل بعض المولِّدات أسهل في الاكتشاف من غيرها ويثير قلقاً من أن أجهزة الكشف قد تُبالغ في التكيّف مع أدوات معينة بدلاً من السمات الأعمق للموسيقى المولَّدة آلياً.

Figure 2
Figure 2.

ماذا يعني هذا للموسيقى والذكاء الاصطناعي

يُظهر مشروع M6 أنه بينما يمكن للحواسيب غالباً تمييز الموسيقى المولَّدة آلياً بدقة في البيئات المألوفة، يبقى الكشف القوي في العالم الواقعي تحدياً كبيراً. يعاني المستمعون البشريون بالفعل للتمييز بين النوعين، وتتعثر الخوارزميات الحالية عندما تتغير الموسيقى في النوع أو اللغة أو الطول أو طريقة التوليد. من خلال إصدار مجموعة بيانات كبيرة ومتنوعة ومفتوحة الوصول، يأمل المؤلفون في تحفيز تطوير أدوات كشف أكثر موثوقية وشفافية. بدورها، يمكن لمثل هذه الأدوات أن تساعد في الحفاظ على الثقة في منصات الموسيقى الرقمية، ودعم الاعتراف العادل بالفنانين البشر، وتوجيه أنظمة الذكاء الاصطناعي المستقبلية نحو التعاون مع الموسيقيين بدلاً من الاستبدال الصامت.

الاستشهاد: Li, Y., Li, H., Specia, L. et al. M6: multi-generator, multi-domain, multi-lingual and cultural, multi-genres, multi-instrument machine-generated music detection databases. Sci Rep 16, 9237 (2026). https://doi.org/10.1038/s41598-026-36044-w

الكلمات المفتاحية: الموسيقى المولَّدة بواسطة الذكاء الاصطناعي, الصوت المزيف العميق, كشف الموسيقى, تعلم الآلة, الإبداع الرقمي