Clear Sky Science · ar
دقة التشخيص لنماذج اللغة الكبيرة متعددة الوسائط في التفريق بين النوبات الصرعية والنوبات الوظيفية في مقاطع الفيديو المسجلة بالهاتف الذكي
لماذا قد يساعد فيديو هاتفك في تشخيص النوبة
عندما ينهار شخص فجأة أو يبدأ في الاهتزاز، غالباً ما يفعل المتواجدون حوله الشيء نفسه الآن: يخرجون هواتفهم الذكية ويضغطون على زر التسجيل. يمكن أن تكون هذه الفيديوهات دلائل منقذة للحياة، تساعد الأطباء في تحديد ما إذا كان الحدث نوبة صرعية أم نوبة شبيهة تُسمى نوبة وظيفية. لكن خبراء الأعصاب محدودون، والانتظار لمراجعة أخصائي للفيديوهات قد يؤخر العلاج. تطرح هذه الدراسة سؤالاً عما إذا كان الذكاء الاصطناعي الحديث، وتحديداً نماذج اللغة الكبيرة متعددة الوسائط، قادرًا على مشاهدة هذه المقاطع الهاتفية اليومية والتفريق بينها بمفرده.

نوعان من الحالات الطارئة المتشابهة
قد تبدو النوبات الصرعية والنوبات الوظيفية متشابهة للعين غير المدربة، لكنها تنجم عن أسباب وعلاجات مختلفة تمامًا. تنشأ النوبات الصرعية من نشاط كهربائي غير طبيعي في الدماغ وعادةً ما تُعالج بالأدوية أو الجراحة. أما النوبات الوظيفية فلست مُحرَّكة بمثل هذه التفريغات الدماغية؛ فهي أحداث حقيقية ومؤلمة تنبع من تداخلات معقدة بين الدماغ والعقل، وتتطلب رعاية مختلفة غالبًا تشمل الدعم النفسي. وبما أن الأحداث قصيرة ومخيفة، يواجه أفراد العائلة صعوبة في وصفها بدقة. توفر التسجيلات المصورة المأخوذة أثناء الحدث صورة أوفى، لكن مراجعتها لا تزال تعتمد على الوصول إلى أخصائيي الصرع الماهرين.
اختبار الذكاء الاصطناعي العام الهدف
جمع الباحثون في مركز صرع كبير 24 مقطع فيديو من هواتف ذكية لعشرين 15 بالغًا خضعت أحداثهم لتشخيص دقيق باستخدام مراقبة الفيديو–تخطيط أمواج الدماغ بالمستشفى، وهو المعيار الذهبي الذي يسجل كلاً من موجات الدماغ والسلوك. أظهرت 19 مقطعًا نوبات صرعية، وخمسة مقاطع أظهرت نوبات وظيفية. ثم قدموا كل فيديو، دون أي معلومات طبية خلفية، إلى أربع نسخ من عائلة نظم الذكاء الاصطناعي العامة (Gemini 1.5 Pro, 2.0 Flash, 2.5 Flash, و2.5 Pro). طُلب من كل نموذج سؤال بسيط: هل كان الحدث صرعيًا أم وظيفيًا؟ كما طُلب من الذكاء الاصطناعي أن يذكر مدى ثقته على مقياس من 1 إلى 10. قارن الفريق إجابات الذكاء الاصطناعي بتشخيصات المستشفى وحسب مقاييس معيارية مثل الدقة والحساسية (مدى تكرار اكتشاف النوبات الصرعية بشكل صحيح) والنوعية (مدى تكرار استبعاد النوبات الوظيفية بشكل صحيح).
ما الذي أصابته الذكاء الاصطناعي—وما أخطأه
أفادت النسخ الأحدث من الذكاء الاصطناعي بأداء أفضل من القديمة، لكن لم يقترب أي منها من استبدال الأخصائي. ارتفعت الدقة التشخيصية الإجمالية من حوالي ثلث الحالات الصحيحة في أقدم نموذج إلى أكثر من النصف صحيح في أحدث نموذجين. كان النظام الأخير، Gemini 2.5 Pro، الأكثر توازنًا: اكتشف قليلًا أكثر من نصف النوبات الصرعية ورفض معظم، ولكن ليس كل، النوبات الوظيفية بشكل صحيح. كانت النسخ الأقدم حذرة للغاية: بالكاد كانت تخطئ في وسم النوبات الوظيفية، لكنها فشلت في الكشف عن الغالبية الساحقة من النوبات الصرعية. ومن المهم أن استراتيجية بسيطة وغير متعمقة تقوم على تسمية كل حدث بأنه “صرعي” كانت ستؤدي إلى دقة إجمالية خام أعلى من أي نموذج — لكنها كانت ستفشل تمامًا في التمييز بين الحالتين، ما يبرز مدى صعوبة هذه المهمة.
لماذا تهم تفاصيل الفيديو كثيرًا
كشفت الدراسة أيضًا أن جودة وتأطير الفيديو أثرَا بقوة على أداء الذكاء الاصطناعي. عندما كانت التسجيلات واضحة ومضاءة جيدًا ومركزة على الجزء العلوي من الجسم أو الوجه، كانت النماذج الأحدث صحيحة في نحو 80–90 بالمئة من الحالات ضمن هذه الفئة. عندما كان الجسم كله ظاهرًا من مسافة بعيدة، أو كانت الإضاءة سيئة، انخفضت الدقة بشكل حاد، أحيانًا إلى ما يقرب من الصفر. كما أن نوع النوبة أحدث فرقًا: فالإصدارات الأولى من الذكاء الاصطناعي فشلت عمليًا مع الأحداث الأرق غير المرتجفة، في حين أن الإصدارات اللاحقة كانت أكثر توازنًا إلى حد ما بين الهزات الواضحة والحالات الأقل درامية. ومع ذلك، عبر جميع النماذج ظلت درجات الثقة مرتفعة سواء كان الجواب صحيحًا أم خاطئًا، ما يعني أن الذكاء الاصطناعي كان كثيرًا ما "واثقًا وهو مخطئ" — وهي سمة مقلقة إذا اعتمد الأطباء أو المرضى على هذه الأحكام.

ما الذي يعنيه هذا للمرضى والأطباء
حتى الآن، الرسالة واضحة: يمكن للذكاء الاصطناعي العام أن يلاحظ أنماطًا في مقاطع فيديو النوبات ويتحسن ببطء، لكنه لا يزال بعيدًا عن أن يكون أداة تشخيصية مستقلة يمكن الوثوق بها. لا تزال الأنظمة تفوت العديد من النوبات الصرعية، وتكافح مع الأحداث الدقيقة، ولا تعرف بعد متى قد تكون مخطئة. يجادل المؤلفون بأن الإصدارات المستقبلية ستحتاج إلى تدريب على مجموعات أكبر بكثير من مقاطع الفيديو الطبية عالية الجودة والمصنفة من قبل خبراء، وطرق أفضل للتعبير عن عدم اليقين، وتكامل أوثق مع تاريخ المرضى وتسجيلات موجات الدماغ. بدلاً من استبدال أطباء الأعصاب، من المرجح أن تصبح هذه الأدوات جزءًا من نهج أوسع يركز على الإنسان، تعمل فيه الهواتف الذكية والأخصائيون والذكاء الاصطناعي المصمم بعناية معًا لتسريع وتحسين تشخيص النوبات.
الاستشهاد: Patel, A., Vallamchetla, S.K., Safa, A. et al. Diagnostic accuracy of multimodal large language models in differentiating epileptic from functional seizures in smartphone recorded videos. Sci Rep 16, 11719 (2026). https://doi.org/10.1038/s41598-026-46333-z
الكلمات المفتاحية: الصرع, مقاطع فيديو النوبات, الذكاء الاصطناعي, نماذج اللغة الكبيرة, التشخيص الطبي