Clear Sky Science · ar

مجموعة بيانات RAID: استجابات بشرية للتحويلات الأفينية للصورة والضوضاء الغاوسية

· العودة إلى الفهرس

لماذا تهم التغييرات الطفيفة في الصورة عينيك

يواجه عيناك يوميًا صورًا مائلة أو مُكبّرة أو مُزاحة أو حبيبية إلى حد ما—فكر في تصوير موضوع متحرك بهاتفك أو التمرير عبر صور وسائل التواصل الاجتماعي التي قد تكون ضبابية قليلًا. لكن كيف يلاحظ الناس هذه التغييرات بالضبط، وهل يمكن تعليم الحواسيب أن تقيس جودة الصورة بالطريقة التي نفعلها نحن؟ يقدم هذا المقال مجموعة بيانات جديدة تُسمى RAID تقيس بدقة كيف يتفاعل المراقبون البشريون مع تشوهات صور بسيطة لكنها شائعة، موفرة جسرًا بين التجربة البصرية اليومية والخوارزميات التي تشغّل الكاميرات وخدمات البث والذكاء الاصطناعي.

Figure 1
Figure 1.

تجربة التعديلات الشائعة على الصور

ركز الباحثون على أربعة تغييرات أساسية تحدث باستمرار في العالم الحقيقي والصور الرقمية: الدوران (إمالة الصورة)، والإزاحة (تحريكها جانبياً)، والتكبير/التصغير (zoom)، وإضافة حبيبات تُعرف بالضوضاء الغاوسية. وعلى خلاف العديد من قواعد بيانات جودة الصورة الموجودة التي تركز على آثار الضغط أو الأخطاء الرقمية، تحاكي هذه التحويلات ما يحدث عندما تحرك رأسك، أو تغير نظرك، أو تتحرك الأشياء ويتغير الإضاءة. باستخدام 24 صورة ملونة طبيعية من مجموعة معروفة لصور كوداك، أنشأ الفريق تسعة مستويات متزايدة من كل تشوه، بالإضافة إلى الأصلية، ليصبح المجموع 888 صورة.

كيف قارن الناس الفروقات بين الصور

لاكتشاف مدى وضوح هذه التغييرات فعلاً، حضر 210 متطوعًا إلى مختبر مُتحكم فيه، جلسوا أمام شاشات مُعايرة، وشاركوا في أكثر من 40,000 تجربة. في كل تجربة، رأوا زوجين من الصور على الشاشة وكان عليهم الإجابة عن سؤال بسيط: أي الزوجين يبدو أكثر اختلافًا عن الآخر، الزوج الأيسر أم الأيمن؟ تُمكّن هذه الطريقة، المعروفة في علم البصر باسم قياس الفرق بالاحتمال الأقصى، الباحثين من تحويل العديد من هذه الاختيارات إلى «مقياس إدراكي» سلس لكل تشوه. كل نقطة على المقياس تُظهر مدى قوة مستوى تشوه معين بالنسبة للمشاهد المتوسط، من تكاد لا تُرى إلى واضحة تمامًا.

Figure 2
Figure 2.

قياس زمن استجابة الدماغ

أثناء اتخاذ الأشخاص لخياراتهم، سجّل التجربة أيضًا مدة استجابتهم. كشفت أزمنة الاستجابة هذا نمطًا كلاسيكيًا يظهر في مجالات إدراكية أخرى: عندما كان الفرق بين الصور صغيرًا جدًا أو كبيرًا للغاية، استجاب الناس بسرعة نسبيًا، بينما تباطأوا عند صعوبة متوسطة. مع ازدياد قوة التشوهات، احتاج النظام البصري وقتًا أقل ليقرر أي زوج يختلف أكثر. يتوافق هذا السلوك مع قاعدة معروفة في علم النفس تُدعى قانون بيرون، التي تربط بين إشارات حسية أقوى واستجابات أسرع، وتدعم فكرة أن مجموعة البيانات تلتقط خصائص حقيقية للبصر البشري بدلاً من ضوضاء عشوائية في قرارات الناس.

المقارنة مع مقاييس الجودة القائمة

لجعل البيانات الجديدة مفيدة للمهندسين والعلماء الذين يعتمدون بالفعل على معايير جودة الصورة المعروفة، قارن المؤلفون قياساتهم للصور المشوشة بالضوضاء مع درجات من قاعدة بيانات شهيرة اسمها TID2013، حيث قيم الناس جودة الصورة على مقياس رأي نموذجي. وجدوا علاقة قوية تكاد تكون خطية: التشوهات التي حكم عليها مراقبو RAID بأنها أكثر وضوحًا كانت تميل إلى الحصول على درجات جودة أقل في TID2013. سمح هذا الارتباط للفريق باستنتاج صيغة بسيطة لتحويل قيم مقياسهم الإدراكي إلى درجات رأي قياسية، مما يسهل دمج RAID مع مجموعات البيانات الأقدم وإدماجه في خطوط تقييم حالية.

لماذا يهم هذا للبصر والذكاء الاصطناعي

بعيدًا عن مطابقة الأعمال السابقة، تبرز مجموعة البيانات الجديدة حالات تتفوق فيها قياساتها الدقيقة على درجات الرأي التقليدية. من خلال البحث عمدًا عن أزواج صور حيث تقول طريقة ما أن التشوهات متشابهة بينما تقول طريقة أخرى إنها مختلفة جدًا، ثم سؤال الناس من منهما على صواب، يظهر المؤلفون أن نهجهم يميل إلى التوافق بشكل أفضل مع ما يلاحظه المشاهدون بالفعل. تكشف مجموعة البيانات أيضًا عن أنماط بديهية: الإمالة البسيطة تكون أكثر وضوحًا بكثير في منظر بحري ذو أفق قوي مقارنة بمشهد مزدحم مليء بالأشكال المائلة، وتبرز الضوضاء أكثر على السماء الملساء مقارنةً بالأسطح ذات التفاصيل. مجتمعة، تعني هذه النتائج أن RAID تقدم وصفًا أغنى وأكثر تمحورًا حول الإنسان لكيفية ملاحظتنا للتغييرات اليومية في الصور، موفرة أرضية اختبار صلبة لتحسين كل من نماذج البصر البشري وأنظمة الذكاء الاصطناعي التي تسعى لرؤية العالم كما نراه.

الاستشهاد: Daudén-Oliver, P., Agost-Beltran, D., Sansano-Sansano, E. et al. RAID-Dataset: human responses to affine image distortions and Gaussian noise. Sci Data 13, 256 (2026). https://doi.org/10.1038/s41597-026-06581-0

الكلمات المفتاحية: جودة الصورة, بصر الإنسان, الإدراك البصري, تشويهات الصورة, علم النفس الحسي