Clear Sky Science · ar

مجموعة بيانات GaMMA للمحادثات الدنماركية متعددة المشاركين مع بيانات النظرة والكلام والحركة في هدوء وضوضاء

· العودة إلى الفهرس

لماذا تهم المحادثات المزعجة

إذا حاولت يومًا التحدث مع أصدقاء في مقهى مزدحم، فربما شعرت كم يصعب متابعة مجرى المحادثة. ومع ذلك، معظم ما يعرفه العلماء عن الكلام والسمع لا يزال قائمًا على تجارب مخبرية منظمة مع متحدث واحد في كل مرة. يقدم هذا المقال مجموعة GaMMA، وهي مجموعة كبيرة ومتاحة مجانًا من محادثات جماعية بنمط حياتي باللغة الدنماركية، تم تسجيلها بقياسات دقيقة لما يقوله الناس، وإلى أين ينظرون، وكيف يحركون رؤوسهم، ومدى شدة الهمهمة المحيطة. صُممت المجموعة لتكون ملعبًا للباحثين الراغبين في بناء معينات سمعية أفضل، وأجهزة اتصال أذكى، ونماذج أكثر واقعية لكيفية تحدثنا في الضوضاء اليومية.

Figure 1
الشكل 1.

التحدث في حفلة الكوكتيل

يركز الباحثون على المحادثات «متعددة المشاركين»—أربع أشخاص يتحدثون معًا، يتناوبون على الكلام، يقاطعون بعضهم البعض، يضحكون، وأحيانًا يتحدثون في وقت واحد. تشكل هذه المواقف ساحة اختبار طبيعية لمشكلة «حفلة الكوكتيل» الكلاسيكية: كيف ينجح المستمعون في التركيز على صوت واحد بين أصوات كثيرة وخلفية صاخبة. تلتقط مجموعات البيانات الموجودة بعض جوانب هذا التحدي، لكنها غالبًا ما تعتمد على مهام مكتوبة، أو مستويات ضوضاء ثابتة، أو مشاركين لا يعرفون بعضهم البعض. بُنيت GaMMA لتشعر أقرب إلى الواقع: كان جميع المشاركين الأربعة والأربعون متحدثين أصليين للدنماركية يتحدثون مع أصدقاء أو عائلة، دون مواضيع أو أدوار محددة، ومع ضوضاء خلفية تتراوح من همهمة هادئة في الغرفة إلى ضوضاء مطعم حيوية وحالة تتصاعد فيها الضوضاء وتخف تدريجيًا.

الرؤية والسمع والحركة معًا

لالتقاط المزيج الغني من الإشارات التي تشكل المحادثة وجهًا لوجه، ارتدى كل شخص ثلاثة أنواع من المعدات: نظارات خفيفة لتتبع العين لتسجيل مكان نظره، وميكروفونات صغيرة داخل الأذن لالتقاط ما يصل إلى أذنهم، وميكروفون صغير معلق على الرأس قرب الفم لتسجيل كلامهم بوضوح. تعقبت ثماني كاميرات تحت الحمراء في الغرفة علامات على النظارات حتى يتمكن الفريق من إعادة بناء موضع واتجاه رأس كل متحدث في ثلاثة أبعاد. وضعت أربعة مكبرات صوت حول الطاولة لتشغيل الهمهمة الخلفية بمستويات مضبوطة بعناية، وتم قياس خواص صدى الغرفة حتى يعرف مستخدمو مجموعة البيانات مستقبلاً كيف تصرف الصوت في ذلك الفضاء.

إجراء تسجيلات تظل طبيعية

كان هدف التصميم الرئيسي تجنب تغيير طريقة كلام الناس واستماعهم. قد تسد الميكروفونات القياسية داخل الأذن قناة الأذن وتغير بشكل طفيف طريقة سماعنا لصوتنا، مما قد يغير أسلوب تحدثنا. لذلك أعاد الفريق تهيئة ميكروفونات سمعية تجارية لتجلس في الأذن مع انسداد طفيف للغاية. استخدموا رأس دمية ومعدات اختبار دقيقة لقياس كم غيّرت هذه الميكروفونات الصوت في قناة الأذن وصمموا مرشحات بحيث يتوافق الصوت المخزن عن كثب مع ما سيصل إلى طبلة أذن حقيقية. كما قاموا معايرة ميكروفونات الرأس بحيث تكون مستويات الكلام قابلة للمقارنة بين المشاركين. تشير إجابات الاستبيانات التي جُمعت بعد الجلسات إلى أنه، على الرغم من المعدات والبيئة المخبرية، شعر الناس عمومًا بأن محادثاتهم طبيعية وأن الإعداد لم يكن متطفلًا بشكل مفرط.

Figure 2
الشكل 2.

تنقية الفوضى

التسجيلات الخام من مثل هذه المشاهد المزدحمة فوضوية: تلتقط الميكروفونات ضوضاء الغرفة، وهمّ الآلات، وأصوات عدة أشخاص في آن واحد. لجعل المجموعة أكثر فائدة، يقدم المؤلفون نسخًا غير معالجة ونسخًا «منقّاة» من الصوت. يقلل خوارزم تعلّم عميق حديث من الهمهمة الخلفية، وتُطبّق طريقة ترشيح تكيُّفية لقمع تسرب أصوات المتحدثين الآخرين إلى ميكروفون كل شخص. ثم يحدد مكشّف نشاط الصوت متى يتحدث كل مشارك. فحص الفريق بشكل منهجي كيف أثرت خطوات المعالجة هذه على جودة الإشارة تحت ظروف مختلفة—مثل عندما يتحدث حامل الميكروفون وحده، أو يتحدث الآخرون فقط، أو عندما يتداخل كلام عدة أشخاص—ووجدوا أنه يمكن تقليل الضوضاء بشكل كبير دون الإضرار الواضح بالصوت الرئيسي.

أداة للدراسة العملية للمحادثات الحقيقية

كُلّ البيانات مزامنة زمنياً بدقة قدر الإمكان وفقًا للأجهزة وموزعة بصيغ معيارية، إلى جانب ملفات معايرة ووثائق عن القيود المعروفة مثل انجراف بسيط في الساعة وفجوات عرضية في تتبع العين. النتيجة أكثر من تسع ساعات من محادثات لأربع أشخاص، سُجلت كل منها عند أربعة إعدادات ضوضاء مختلفة، مع كلام، ونظرة، وحركة متزامنة. للعلماء والمهندسين، تقدم GaMMA فرصة نادرة لدراسة كيف يحوّل الناس نظراتهم، ويضبطون كلامهم، وينسّقون التناوب على الكلام في بيئات اجتماعية حقيقية. للقراء العامين، الخلاصة أن فهم وتحسين التواصل في أماكن الضوضاء يتطلب احتضان التعقيد الكامل لكيفية تحدثنا واستماعنا ونظرنا وتحركنا معًا—وهذه المجموعة خطوة مهمة نحو هذا الهدف.

الاستشهاد: Dourado, M., Gert Hassager, H., Udesen, J. et al. The GaMMA corpus of Danish polyadic conversations with gaze speech and motion data in quiet and noise. Sci Data 13, 494 (2026). https://doi.org/10.1038/s41597-026-06851-x

الكلمات المفتاحية: ظاهرة الحفلة الكوكتيل, محادثة متعددة الوسائط, الكلام في الضوضاء, تتبُّع النظرة, مجموعة بيانات أبحاث السمع