Clear Sky Science · ar

بيانات المشاهد على مستوى المشهد من Amazon X-Ray في سوق الولايات المتحدة مدمجة مع IMDb

· العودة إلى الفهرس

لماذا تهم مشاهد الأفلام لفهم الثقافة

تشكل الأفلام طريقة رؤيتنا للعالم، ومع ذلك ركزت معظم الأبحاث السينمائية على أرقام شباك التذاكر والأنواع الأساسية أو قوة النجومية، وليس على ما يحدث فعلاً على الشاشة مشهداً تلو الآخر. يقدم هذا المقال مجموعة بيانات جديدة تتيح للباحثين التكبير إلى مستوى المشاهد الفردية والشخصيات وسطور الحوار لأكثر من ثلاثة آلاف فيلم يتم بثها في الولايات المتحدة عبر Amazon Prime Video. من خلال دمج ميزة X-Ray من أمازون مع قاعدة بيانات الإنترنت للأفلام (IMDb)، يقدم المؤلفون خريطة مفصلة وموحدة لمن يظهر أين ومتى في كل فيلم، ما يفتح الباب لدراسات أعمق عن التمثيل والسرد وحتى أنظمة الذكاء الاصطناعي التي تتعلم من الفيديو.

Figure 1
Figure 1.

من النصوص الأولية إلى المشاهد النهائية

حتى الآن، اعتمدت معظم الدراسات واسعة النطاق للأفلام على السيناريوهات أو ملفات الترجمة. هذه المصادر مفيدة لكنها غير كاملة. النصوص غالباً ما تكون مسودات مبكرة تختلف عن النسخة النهائية، وقد تحذف شخصيات ثانوية أو تغييرات تحريرية لاحقة. تلتقط الترجمات السطور المنطوقة لكنها تفشل في رصد الشخصيات الصامتة والتمثيل الخلفي والسرد البصري بحت—مثل كاميرا تطيل النظر في وجه شخصية ما، على سبيل المثال. بسبب هذه الثغرات، اضطرت الجهود السابقة لتعقب من يتفاعل مع من على الشاشة، أو كيف يتم تمثيل مجموعات مختلفة، إلى التخمين بناءً على النص وحده، وهو ما قد يؤدي إلى أخطاء في تحديد الشخصيات وعلاقاتها.

تحويل X-Ray إلى بيانات جاهزة للبحث

تقدم ميزة X-Ray من أمازون طريقاً لتجاوز هذه المشكلات. عندما يوقف المشاهد الفيلم مؤقتاً، يعرض X-Ray الممثلين والشخصيات الموجودين حالياً على الشاشة، وهي معلومات مُنسقة ومرتبطة مباشرة بالنسخة النهائية للفيلم. بنى المؤلفون خط معالجة لاستخراج بيانات المشاهد هذه لعدد 3,265 فيلم متاح في كتالوج Prime Video في الولايات المتحدة حتى أغسطس 2023. جمعوا أولاً جميع إدخالات الأفلام المشمولة في Prime، استبعدوا تلك التي لا تحتوي على معلومات X-Ray، وأزالوا التكرارات الناتجة عن عناوين مكررة أو إصدارات بديلة. لكل فيلم متبقٍ، اعترضوا تدفقات البيانات المستخدمة من اللاعب لتحميل معلومات X-Ray والترجمة، وحفظوا النتائج في ملفات منظمة تسرد حدود المشاهد، والشخصيات الحاضرة في كل مشهد، وللعديد من العناوين، التوقيت الدقيق لكل مقطع ترجمة.

ربط المشاهد بعالم الأفلام الأوسع

تأتي القوة الحقيقية لمجموعة البيانات من ربط تقسيمات المشاهد هذه بمعلومات خارجية. بينما يربط X-Ray بالفعل كل شخصية بملف على IMDb، فإنه لا يتضمن معرف IMDb للفيلم نفسه. صمم المؤلفون خوارزمية مطابقة تبدأ من عنوان الفيلم، تسترجع عدة مرشحين من IMDb، ثم تقارن طاقم التمثيل المدرج في المرتبة الأولى على IMDb مع الممثلين المدرجين في بيانات X-Ray. إذا تداخل على الأقل ممثل رئيسي واحد، اعتُبر الفيلم مطابقاً. طابقت هذه العملية الآلية غالبية الأفلام بشكل صحيح، ثم تحقق الفريق يدوياً من بضع مئات من الحالات الحدية المتبقية، مصححين التصنيفات الخاطئة ومزيلين الإدخالات التي لم تكن أفلاماً سردية فعلية، مثل عروض الكوميديا المنفردة. النتيجة النهائية هي مجموعة منظفة بعناية من الأفلام حيث يمكن ربط كل مشهد وشخصية وترجمة ببيانات وصفية غنية مثل سنة الإصدار والبلد وديموغرافيات فريق التمثيل.

Figure 2
Figure 2.

ما الذي يمكن للباحثين فعله بهذه الأفلام

لأن لكل مشهد أوقات بداية ونهاية واضحة وقائمة بمن يظهر فيه، يستطيع الباحثون الآن بناء خرائط دقيقة لتفاعلات الشخصيات ووقت الظهور على الشاشة. تجعل الترجمات المصاحبة للمشاهد من الممكن دراسة كيف تختلف اللغة بين الشخصيات والسياقات، أو كيف تتكشف مواضيع معينة عبر الحوار. بدمج مجموعة البيانات هذه مع معلومات إضافية من IMDb ومصادر أخرى، يمكن للباحثين فحص أسئلة مثل: كيف تغير توازن الجنسين على الشاشة عبر العقود؟ هل تحصل الشخصيات من خلفيات مختلفة على قدر متساوٍ من الاهتمام السردي؟ كيف تختلف أنماط التفاعل بين الأنواع أو البلدان؟ كما توفر مجموعة البيانات معياراً ذا جودة عالية لنماذج الذكاء الاصطناعي التي تهدف لفهم محتوى الفيديو، لأنها تزود بحقيقة أرضية عن من هو مرئي ومتى.

عدسة جديدة على الأفلام اليومية

بعبارات بسيطة، يحوّل هذا العمل آلاف الأفلام إلى فهرس قابل للبحث مشهداً بمشهد عن من يظهر ومن يتحدث وكيف تُبنى القصص. ورغم أن المجموعة محدودة بالعناوين المتاحة على Prime Video في الولايات المتحدة وتعتمد على عمليات X-Ray الداخلية لأمازون، فإنها تغطي أفلاماً عبر عقود وأنواع كثيرة، وليست مقتصرة على الفائزين بالجوائز الشهيرة فحسب. تتيح هذه السعة للباحثين دراسة الأفلام اليومية، وليس فقط الكلاسيكيات التي تبقى في الذاكرة. ومع تحديث وتوسيع مجموعة البيانات، فإنها تعد بتعميق فهمنا لكيفية انعكاس الأفلام للمجتمع—ولإعطاء علماء الاجتماع والتقنيين صورة أكثر دقة عما يحدث فعلاً على الشاشة.

الاستشهاد: Shrestha, S., Heo, Y., Barron, A.T.J. et al. Scene-level movie data from Amazon X-Ray in the US market combined with IMDb. Sci Data 13, 275 (2026). https://doi.org/10.1038/s41597-026-06602-y

الكلمات المفتاحية: مجموعات بيانات الأفلام, تحليل على مستوى المشهد, Amazon X-Ray, بيانات وصفية من IMDb, التمثيل على الشاشة