Clear Sky Science · ar
تقييم قابلية قراءة النصوص التعليمية تلقائياً بناءً على تعلم التمثيل البياني
لماذا يهم هذا للمعلمين والمتعلمين
عندما يختار المعلمون قطعة قراءة، يواجهون توازناً دقيقاً: يجب أن يكون النص صعباً بما يكفي لتعزيز التطور، لكنه لا ينبغي أن يكون صعباً إلى درجة يدفع الطلاب للتخلي عنه. تقدم هذه الورقة طريقة جديدة في الذكاء الاصطناعي تستطيع تقدير مدى صعوبة قطعة القراءة، خصوصاً للمواد التعليمية. من خلال النظر أبعد من العدّات البسيطة للكلمات والجمل إلى البنية الأعمق للغة، يهدف النظام لمساعدة المطابقة بدقة أكبر بين النص والقارئ مقارنة بصيغ القابلية للقراءة التقليدية.
حدود درجات القابلية للقراءة القديمة
لعقود، اعتمدت المدارس على صيغ مثل فليش–كينكايد التي تستخدم دلائل سطحية—مثل طول الجملة وعدد المقاطع—لحكم الصعوبة. هذه الأساليب سهلة الحساب لكنها عمياء عن كثير من جوانب التعقيد في العالم الحقيقي. فقرة علمية قصيرة ومثقلة بالمصطلحات الفنية أو جملة ذات تركيبة ملتوية قد تُصنّف «سهلة» لأن كلماتها قصيرة وجملها مقتضبة. ونتيجة لذلك، قد يعيّن المعلمون مواداً صعبة للغاية لبعض الطلاب أو بسيطة جداً لآخرين، لا سيما في المواد الغنية بالمحتوى مثل العلوم والدراسات الاجتماعية.
نظرة داخل الجملة
يقترح المؤلفون نهجاً مختلفاً يعامل كل جملة كشبكة. تصبح كل كلمة نقطة (أو عقدة)، والروابط النحوية بين الكلمات—مثل الفاعل–الفعل أو الفعل–المفعول—تصبح اتصالات (حواف). والأهم أن قوة كل اتصال تعتمد ليس فقط على المسافة في الجملة بل أيضاً على نوع الكلمات الموجودة في الوسط. مسافة طويلة مليئة بكلمات محتوى مثل الأسماء والأفعال والصفات تشير إلى قفزة ذهنية مطلِبة؛ أما مسار أقصر أو مملوء في الغالب بكلمات وظيفية صغيرة فيقترح خطوة أسهل. تُظهر أبحاث علم النفس اللغوي أن هذه التحويلات الطويلة والمليئة بالمحتوى تُجهد الذاكرة العاملة وتبطئ الفهم، لذا يستخدم النموذج هذه العلامات للدلالة على صعوبة أعلى.

تعليم شبكة لقراءة الشبكة
لاستغلال فكرة الجملة كشبكة، يستخدم الدراسة نوعاً من الشبكات العصبية المصممة للرسوم البيانية، يسمى شبكة الالتفاف البيانية (Graph Convolutional Network). قبل تشغيل نموذج الرسم البياني، تُنتج وحدة ذكاء اصطناعي أخرى (مماثلة للأنظمة واسعة الانتشار مثل BERT) تمثيلاً رقمياً غنياً لكل كلمة يعكس معناها في السياق. ثم يمرر نموذج الرسم البياني المعلومات عبر الاتصالات بين الكلمات، جامعاً المعنى والبنية لتكوين تمثيل مختصر واحد للقطعة بأكملها. يُغذى هذا الملخص إلى طبقة نهائية تُنتج درجة قابلية قراءة مستمرة بدلاً من فئة بسيطة، مما يسمح بتمييزات أدق بين النصوص.
لاستخلاص أفضل أداء من النظام، يستخدم المؤلفون التحسين البايزي، وهي استراتيجية تبحث تلقائياً عن إعدادات جيدة للعديد من «المقابض» في آن واحد. تشمل هذه الإعدادات مدى تأثير فئات الكلام المختلفة على قوة الاتصال، وعدد طبقات الرسم البياني المستخدمة، وسرعة تعلم النموذج. بدلاً من ضبط هذه الخيارات يدوياً، تختبر إجراء التحسين نظامياً وتكرره استناداً إلى نتائج التحقق.

مدى فاعليته عملياً
اختُبر النموذج على مجموعة بيانات CLEAR، وهي مجموعة كبيرة تضم نحو 5,000 فقرة قصيرة مع درجات قابلية قراءة مُعيّنَة من خبراء وتصنيفات محتوى شبيهة بتصنيف الأفلام (G، PG، PG-13، وR). باستخدام مخطط تحقق متقاطع صارم، يشرح النظام حوالي 97% من التباين في هذه الدرجات، وهو مستوى دقة يتفوق على كل من الطرق التقليدية المعتمدة على الميزات والقواعد والمرتكزة على نماذج المحولات الحديثة وحدها. كما يقدم الأسلوب أداءً جيداً عند تطبيقه على مجموعة بيانات فارسية بُنيت أصلاً لتصنيف النصوص إلى مستويات سهلة ومتوسطة وصعبة: تميل الفقرات ضمن نفس مجموعة الصعوبة إلى تلقي درجات متوقعة متشابهة، مما يشير إلى أن ما يتعلمه النموذج عن البنية في الإنجليزية يمكن أن ينتقل إلى لغة أخرى.
ماذا يعني هذا للفصول الدراسية
بالنسبة للمعلمين ومصممي المناهج، الخلاصة الأساسية أن قابلية القراءة لا تتعلق بالكلمات الطويلة والجمل الطويلة فحسب. تلعب الطريقة التي تُنسَج بها المعلومات داخل الجملة—عدد التحويلات وأنواع الكلمات التي تملأها—دوراً مهماً في مدى سهولة متابعة الطلاب. من خلال نمذجة النصوص كشبكات من الكلمات المترابطة واستخدام ذكاء اصطناعي قائم على الرسوم لقراءة تلك الشبكات، يقدم هذا البحث أداة أكثر دقة ومرونة لتقدير صعوبة القراءة. وبينما لا يلغى الحكم البشري أو يحصي كل تفاصيل الأدب ونثر العلوم الاجتماعية، يمكن أن يكون مساعد قرار قوي، يساعد المعلمين على اختيار وتكييف النصوص التي تناسب مهارات طلابهم وتدعم تعلماً أكثر شمولية.
الاستشهاد: Zhang, L., Abhani, J., B, J. et al. Automatic text readability assessment for educational content based on graph representation learning. Sci Rep 16, 11308 (2026). https://doi.org/10.1038/s41598-026-41313-9
الكلمات المفتاحية: تقييم قابلية القراءة, النصوص التعليمية, الشبكات العصبية البيانية, معالجة اللغة الطبيعية, صعوبة النص