Clear Sky Science · ar
الذكاء البشري مقابل الاصطناعي: فحص قدرة الأكاديميين الشباب من مؤسسات بحثية وغير بحثية على تمييز الملخصات البحثية في طب الأسنان المُولَّدة بواسطة ChatGPT
لماذا تهم هذه الدراسة القارئ العادي
مع دخول أدوات مثل ChatGPT بسرعة إلى الفصول الدراسية والمختبرات البحثية، يسأل كثيرون سؤالاً بسيطاً: هل نستطيع فعلاً تمييز متى كتبت الحاسوب شيئاً يبدو علمياً؟ تركز هذه الدراسة على هذه المشكلة في سياق عملي للغاية—أبحاث طب الأسنان—وتقوم باختبار ما إذا كان أساتذة الجامعة الشباب قادرين على تمييز الملخصات البحثية المكتوبة بواسطة الذكاء الاصطناعي، وكيف تقارن مهاراتهم ببرامج متخصصة في كشف محتوى الذكاء الاصطناعي.

اختبار البشر والآلات
ركز الباحثون على قسم محدد ومهم من الكتابة العلمية: الملخص، وهو الملخص القصير في بداية الورقة البحثية الذي يطلع عليه معظم القراء أولاً. جمعوا 75 ملخصاً حقيقياً من دوريات رائدة في طب الأسنان ثم طلبوا من ChatGPT كتابة 75 ملخصاً جديداً باستخدام نفس العناوين. نتج عن ذلك مجموعة مكوّنة من 150 نصاً—نصفها مكتوب بشرياً ونصفها مُولَّد بواسطة الذكاء الاصطناعي—تبدو كمُلخصات بحثية حقيقية لكن مصدرها اختلف بطرق لم تكن ظاهرة للمراجعين.
الأكاديميون الشباب في قفص الاختبار
تم توظيف ستة أكاديميين في بداية مسيرتهم في طب الأسنان، جميعهم لديهم أقل من سنتين من الخبرة في التدريس والبحث، من ست جامعات في ماليزيا—ثلاث جامعات حكومية بحثية وثلاث مؤسسات خاصة غير بحثية. تلقى كل مشارك مزيجاً من الملخصات الحقيقية والمولَّدة آلياً، وقد جرى إزالة أي أسماء دوريات أو تفاصيل مؤلفين بحيث بقيت الصياغة فقط. طُلب منهم تحديد ما إذا كان كل ملخص بشرياً أم مُولَّداً آلياً، وتقييم جودته باستخدام ورقة تقييم بسيطة قيمت الوضوح، والتدفق، والإبداع، وعمق الفهم، والنحو، واستخدام المصطلحات التقنية، والمعرفة الخاصة بالمجال.
كيف تُقيّم البرامج نفس النصوص
ثم قُيِّمت نفس الملخصات الـ150 بواسطة ثلاثة مكتشفات لمخرجات الذكاء الاصطناعي ومدقق تشابه واسع الاستخدام. تُقدّر مكتشفات الذكاء الاصطناعي مدى احتمال أن يكون النص قد صدر من نظام مثل ChatGPT، بينما يقارن مدقق التشابه (Turnitin) النص بقاعدة بيانات ضخمة من الكتابات الموجودة ليرى مدى تطابقه. تمثل هذه الأدوات معاً أنواع الضوابط الرقمية التي بدأت الجامعات تعتمد عليها لحماية النزاهة الأكاديمية مع انتشار الكتابة المدعومة بالذكاء الاصطناعي.

من كان أفضل، البشر أم الآلات؟
واجه الأكاديميون الشباب صعوبات أكثر مما قد يتوقعون. تراوحت نسبة نجاحهم في تمييز ما إذا كان الملخص بشرياً أم مُولَّداً آلياً بين 44% و76%—أي ليست أفضل بكثير من التخمين الحذر في بعض الحالات. ولم يظهر مراجِعو الجامعات البحثية تفوقاً واضحاً على نظرائهم في المؤسسات الخاصة ذات الطابع التعليمي؛ فالفروق الفردية كانت أكثر أهمية من نوع المؤسسة. ومن المثير للاهتمام أنه عند تقييم الجودة، ميّل المراجعون إلى تصنيف الملخصات الحقيقية على أنها جيدة إلى ممتازة، بينما اعتُبرت الملخصات المولَّدة آلياً في أغلبها متوسطة، مما يشير إلى أنهم شعروا بفروق في العمق والدقة حتى عندما أخطأوا في تبيان من كتب النص.
مكتشفات تفوقت على مستخدميها البشر
ثبت أن البرمجيات، وخاصة أداة واحدة تُدعى GPTZero، أكثر موثوقية في التمييز بين الكتابة البشرية والآلية. صنفت GPTZero حوالي تسعة من كل عشرة ملخصات بشكل صحيح، أفضل بكثير من المراجعين البشر وأفضل من المكتشفين الآخرين اللذين اختُبرا. كما أدّى مدقق التشابه أداءً قوياً: فقد أظهرت معظم الملخصات الحقيقية تشابهاً عالياً للغاية مع المصادر الموجودة (لأنها أعمال منشورة بالفعل)، بينما كانت الملخصات المولَّدة آلياً تميل إلى تشابه منخفض إلى متوسط، مما يعكس قدرة ChatGPT على إعادة الصياغة بدلاً من النسخ. أظهرت هذه الأدوات مجتمعة أن الكشف الآلي يمكنه حالياً التفوّق على الحكم البشري غير المعاون، على الأقل بالنسبة لأكاديميين شباب يقرؤون نصوصاً تقنية.
ما الذي يعنيه ذلك للتعليم والبحث
لغير المتخصصين، الرسالة الأساسية هي أن حتى الأكاديميين الشباب المتدربين يجدون صعوبة في كشف الملخصات البحثية المصقولة المكتوبة بواسطة الذكاء الاصطناعي بمجرد قراءتها، وأن بيئتهم المؤسسية—سواء كانت بحثية أم لا—لا تضمن حدساً أقوى. وفي الوقت نفسه، تقوم بعض أدوات الكشف بالفعل بعمل جيد بشكل مدهش، رغم أنها ليست مثالية وقد تتغير دقتها مع تطور نظم الذكاء الاصطناعي. يستنتج المؤلفون أنه لا ينبغي للجامعات الاعتماد على الحكم البشري وحده، ولا على أي مكتشف منفرد. بدلاً من ذلك، يدعون إلى نهج مركب: تحسين تدريب الكوادر المبكرة في محو الأمية حول الذكاء الاصطناعي، والاستخدام المدروس لعدة أدوات كشف، وإرشادات أخلاقية واضحة بحيث تعمل الخبرة البشرية والذكاء الاصطناعي معاً لحماية موثوقية الكتابة العلمية.
الاستشهاد: AL-Rawas, M., Abdul Qader, O.A.J., Lin, G.S.S. et al. Human versus artificial intelligence: investigating ability of young academics from research and non-research institutions to identify ChatGPT-generated dental research abstracts. Sci Rep 16, 12287 (2026). https://doi.org/10.1038/s41598-026-42555-3
الكلمات المفتاحية: ChatGPT, النزاهة الأكاديمية, كشف الذكاء الاصطناعي, أبحاث طب الأسنان, أكاديميون في بداية مسيرتهم