Clear Sky Science · ar

صلاحية وعدالة تقييم الكفاءة العالمية في بيرس 2018: تقييم قائم على الحجاج عبر نماذج الاستجابة البنيوية التفسيرية

· العودة إلى الفهرس

لماذا تهم هذه الدراسة في الحياة اليومية

ينشأ المراهقون اليوم في عالم تتجاوز فيه الأخبار والأصدقاء والوظائف المستقبلية الحدود الوطنية. تحاول المدارس إعدادهم للتعامل مع ثقافات مختلفة، وفرز المعلومات عبر الإنترنت، والعمل مع أشخاص يختلفون عنهم. حاول برنامج التقييم الدولي للطلاب (PISA) قياس هذه «الكفاءة العالمية» في عام 2018. تطرح هذه الدراسة سؤالاً بسيطاً لكنه مهم: هل يمكننا الوثوق في درجات هذا الاختبار لبيان من هو حقاً كفء عالمياً، وهل هي عادلة تجاه مجموعات مختلفة من الطلاب؟

Figure 1
الشكل 1.

نظرة مقربة على اختبار مدرسي عالمي

أدَّى طلاب في العديد من البلدان امتحان بيرس 2018 للكفاءة العالمية وكان يُنظر إليه كمؤشر رئيسي على مدى استعداد نظم التعليم للشباب لعالم مترابط. ومع ذلك، تقلق الباحثون والمربون من أن مفهوم الكفاءة العالمية صعب التحديد وقد يتأثر بوجهات نظر غربية وتحيزات ثقافية. تتعمق هذه الورقة في أداء الطلاب الكنديين الذين خاضوا الاختبار وتفحص البنود والنتائج بعناية. يستخدم المؤلف نهجاً منظماً للصدق: بدايةً بالسؤال عما إذا كانت الإجابات تُرصَد بشكل متسق، ثم ما إذا كانت الدرجات ستبدو متشابهة عبر نسخ الاختبار المختلفة، وما إذا كانت تتوافق مع مؤشرات أخرى للكفاءة العالمية، وأخيراً ما إذا كانت تعامل الأولاد والبنات بعدل.

كيف نُحلل الاختبار والطلاب

استخدم الباحث عائلة إحصائية حديثة من الأساليب تنظر ليس فقط فيما إذا كان الطلاب يجيبون عن البنود صحيحة أو خاطئة، بل أيضاً في كيفية تأثير خصائص الاختبار وخصائص الطلاب على صعوبة كل سؤال. تُجمَع بنود بيرس للكفاءة العالمية في مجموعات صغيرة قائمة على سرد قصصي تُسمى «حزم بنود» وتُوزع في كراسات أو نسخ مختلفة. عالجت الدراسة كل مجموعة كراسة على حدة، وملأت كميات ضئيلة من البيانات المفقودة بطرق تعويضية حذِرة، ثم جمعت النتائج عبر المجموعات باستخدام التحليل التلوي. إلى جانب درجات الاختبار، استخدمت الدراسة إجابات الطلاب على أسئلة استقصائية حول الثقة في التعامل مع القضايا العالمية، والاحترام للأشخاص من ثقافات أخرى، والوعي بالتواصل بين الثقافات، والمواقف تجاه المهاجرين.

ما الذي وجدته الدراسة حول جودة الدرجات

أظهرت التحليلات أن تجميع البنود على أساس السرد لم يَشَوِه بمفرده مدى صعوبة البنود على نحو ملحوظ. بعبارة أخرى، إن وضع أسئلة معاً في سيناريو لم يؤثر بشدة على النتائج بعد احتساب القدرة العامة. مع ذلك، جعلت بعض الكراسات البنود أصعب قليلاً من غيرها، مما يشير إلى أن النسخة التي يتلقاها الطالب يمكن أن تُزَيّح الدرجات صعوداً أو هبوطاً بشكل طفيف. على مستوى الطالب، أمكن ملاحظة أن من أبلغوا عن ثقة أعلى في التعامل مع القضايا العالمية، واحترام أكبر للتنوع الثقافي، وحساسية أكبر للتواصل بين الثقافات، أدوا أداءً أفضل في المهام المعرفية. وكانت هذه الروابط مستقرة إلى حد كبير عبر الكراسات المختلفة. لم تتصرف كل السِمات المرتبطة كما كان متوقعاً: بعض مقاييس الشعور بالانفتاح العالمي أو الوعي بالقضايا العالمية أظهرت روابط ضعيفة أو حتى سلبية طفيفة مع أداء الاختبار، مما يبرز مدى تعقيد وتعدد أبعاد الكفاءة العالمية.

Figure 2
الشكل 2.

التحقق من العدالة بين البنات والأولاد

فحصت الدراسة أيضاً ما إذا كانت بنود معينة تمنح ميزة غير عادلة للبنات أو للأولاد بعد التحكم في القدرة العامة. بالنسبة لمعظم البنود، كانت الفروق بين الجنسين طفيفة ومتناقضة، ما يعني أن البنود تصرفت بطريقة مشابهة لكلتا المجموعتين. أظهرت مجموعة صغيرة من البنود ميزات متوسطة أو كبيرة، وغالباً لصالح البنات وفي بعض الأحيان لصالح الأولاد. كانت هذه البنود قليلة العدد لكنها متسقة بما يكفي عبر نسخ الاختبار لتستدعي مراجعة أقرب. والأهم من ذلك، لم تظهر دلائل على أن الاختبار ككل متحيز ضد أي من الجنسين، لكن بعض البنود الفردية يمكن تحسينها أو استبدالها في النسخ المستقبلية.

ما معنى ذلك لاستخدام درجات الكفاءة العالمية

بالنسبة للقراء خارج عالم الاختبارات، الخلاصة هي أن درجات الكفاءة العالمية في بيرس 2018 للطلاب الكنديين صحيحة إلى حد كبير: إنها تلتقط قدرة حقيقية مرتبطة بكيفية تفكير الشباب واستجابتهم لمواقف عالمية وعابرة للثقافات، وتفعل ذلك بطرق عادلة إلى حد كبير. في الوقت نفسه، تبرز الدراسة أن تفاصيل تصميم الاختبار — مثل النسخة التي يحصل عليها الطالب وكيفية تعريف السمات الاستقصائية — يمكن أن تشكل النتائج بشكل طفيف. وتؤكد أن قياس مفهوم غني مثل الكفاءة العالمية ممكن لكنه يتطلب رعاية مستمرة لكيفية صياغة الأسئلة، وكيفية تجميعها، وكيفية عملها لمختلف أنواع الطلاب.

الاستشهاد: Yavuz, E. Validity and fairness of the PISA 2018 Global Competence assessment: an argument-based evaluation via explanatory item response models. Humanit Soc Sci Commun 13, 570 (2026). https://doi.org/10.1057/s41599-026-06979-6

الكلمات المفتاحية: الكفاءة العالمية, PISA 2018, التقييم التعليمي, عدالة الاختبار, نمذجة استجابة البنود