Clear Sky Science · ar

الذكاء البشري مقابل الذكاء الاصطناعي في تشخيص أمراض الفم النسيجية: دراسة مقارنة بين ChatGPT وGrok وMANUS

· العودة إلى الفهرس

لماذا يهم هذا في زيارتك التالية لطبيب الأسنان

عندما يكتشف طبيب الأسنان بقعة مريبة في فمك، عادة ما يصدر الاختصاصي الذي يدرس الأنسجة تحت المجهر الحكم النهائي على ما إذا كانت حميدة أم خطيرة. هذا العمل دقيق ويستغرق وقتاً، وفي كثير من مناطق العالم لا يتوفر عدد كافٍ من الخبراء. تطرح هذه الدراسة سؤالاً ملحاً: هل يمكن لأنظمة الذكاء الاصطناعي الحديثة أن تساعد في قراءة هذه الصور الميكروسكوبية لأنسجة الفم بدقة تقترب من دقة الاختصاصيين البشريين، مما يجعل التشخيص أسرع وأكثر اتساقاً ومتوفراً على نطاق أوسع؟

Figure 1
الشكل 1.

ما الذي حاول الباحثون اختباره

ركز الفريق على ثلاثة برامج حاسوبية متقدمة معروفة بقدرتها على فهم الصور واللغة معاً: ChatGPT وGrok ونظام طبي يُدعى MANUS. بدلاً من استخدام بيانات مرضى حقيقية، اعتمدوا على 100 صورة ميكروسكوبية واضحة وعالية الجودة مأخوذة من كتاب دراسي معياري لأمراض الفم. كل صورة أظهرت نوعاً مختلفاً من المشاكل، بدءاً من التغيرات المبكرة ما قبل السرطانية إلى الأورام والأكياس والنموّات التفاعلية. اتفق اثنان من أخصائيي أمراض الفم ذوي الخبرة أولاً على التشخيص الصحيح لكل شريحة، فشكلا معياراً بشرياً قوياً لمقارنة أداء الآلات معه.

كيف جرت المقارنة المباشرة

عُرضت كل واحدة من الشرائح المئة على الأنظمة الثلاثة نفسها باستخدام نفس الرسالة القصيرة التي تصف الحالة ونفس الصورة الرقمية. طُلب من النماذج تسمية التشخيص الوحيد الأكثر احتمالاً، تماماً كما يفعل اختصاصي عند إصدار تقرير. وللاطلاع على ما إذا كانت الأنظمة تعطي إجابات مستقرة عبر الزمن، كرر الباحثون العملية بأكملها بعد أسبوعين بنفس الشرائح والتعليمات. في المقابل، قرأ الخبيران البشريان الشرائح كل منهما بشكل مستقل دون الاطلاع على مخرجات الذكاء الاصطناعي، ثم ناقشا أي اختلافات حتى توصلا إلى قرار نهائي. عُدّت هذه القرارات الخبيرة أفضل إجابة متاحة.

Figure 2
الشكل 2.

كيف آداء الآلات والبشر

أدّت أدوات الذكاء الاصطناعي الثلاثة أداءً ملفتاً. في الجولة الثانية من الاختبار، حدد Grok 97 حالة من أصل 100 بشكل صحيح، وMANUS حدد 96، وChatGPT حدد 94. سجل الزوج من الاختصاصيين البشريين نتيجة أعلى قليلاً، إذ صنفا 98 شريحة بشكل صحيح. تميز ChatGPT بتقديم إجابات متطابقة تقريباً في الجولتين، مما أظهر اتساقاً داخلياً قوياً، بينما أظهر كل من MANUS وGrok أداءً ثابتاً وصلباً أيضاً. وعندما قورنت الأنظمة ببعضها، اتفقت على الغالبية العظمى من الحالات، ما يشير إلى أن تصميمات الذكاء الاصطناعي المختلفة قد تتوصل إلى أحكام متشابهة جداً عند تزويدها بصور عالية الجودة نفسها.

مدى تقارب الذكاء الاصطناعي من تفكير الخبراء

مطابقة الإجابة الصحيحة جزء من القصة فقط؛ فالاهتمام أيضاً موجّه لمعرفة ما إذا كانت الحواسيب تميل إلى الاتفاق مع أنماط تفكير البشر. هنا أظهر MANUS أقرب توافق مع قرارات الأطباء، حتى عندما لم يتفوق في الدقة الخام على Grok. Grok، رغم أنه كان أدق قليلاً عموماً، أحياناً اختار خيارات مختلفة عن الخبراء في الحالات الصعبة القليلة. نشأت معظم الأخطاء عند الأنظمة الثلاثة في شرائح كانت مربكة بصرياً حتى للعيون المدربة، حيث تداخلت التغيرات النسيجية أو بدت على الحدود بين حالتين. ومع ذلك، لم تكن هناك فجوات أداء كبرى بين النماذج، وأظهر الثلاثة مستويات توافق مع البشر وصفتها الدراسة بالمعتدلة إلى الكبيرة.

ماذا قد يعني هذا للرعاية المستقبلية

تشير الدراسة إلى أن أنظمة الذكاء الاصطناعي متعددة الوسائط الحالية قادرة بالفعل على العمل كمساعدين موثوقين في التشخيص الميكروسكوبي لأمراض الفم. فهي ليست بديلاً عن أطباء الأمراض النسيجية، الذين حافظوا على أفضل دقة إجمالية ويقدمون حكماً سريرياً ضرورياً، لكنها قد تعمل كقارئ ثانٍ سريع، أو تدعم تدريب اختصاصيين جدد، أو تقدم مساعدة بمستوى خبير في المناطق ذات الوصول المحدود إلى خدمات علم أمراض الأسنان. وبما أن البحث استخدم صوراً مختارة بعناية من كتب مدرسية بدلاً من عينات العالم الحقيقي الفوضوية، يؤكد المؤلفون الحاجة لمزيد من الاختبارات على مجموعات إكلينيكية أكبر وأكثر تنوعاً ومع معلومات مضافة عن المرضى. إذا أكدت هذه الاختبارات اللاحقة الوعد المبكر، فقد يجعل الذكاء الاصطناعي تشخيص أمراض الفم أدق وأكثر اتساقاً ومتوفراً للمرضى في كل مكان.

الاستشهاد: Alshammari, A.F., Madfa, A.A. & Anazi, B.A. Human versus artificial intelligence in oral pathology diagnosis: a comparative study of ChatGPT, Grok, and MANUS. Sci Rep 16, 11057 (2026). https://doi.org/10.1038/s41598-026-40792-0

الكلمات المفتاحية: أمراض فمية نسيجية, علم الأمراض الرقمي, الذكاء الاصطناعي, نماذج لغوية كبيرة, تشخيص النسيج المرضي