Clear Sky Science · ar
مقارنة أداء الذكاء الاصطناعي والمتخصصين في الرعاية الصحية في تحليل مقاطع الفيديو الجراحية والتداخلية: مراجعة منهجية وتحليل تلوي
عيون أذكى في غرفة العمليات
في كل عام، يخضع مئات الملايين من الأشخاص لعمليات وإجراءات طفيفة التوغل تعتمد على الفيديو — فكر في تنظير القولون، الجراحة بالمناظير، أو كاميرات صغيرة تدخل الأوعية الدموية. في هذه اللحظات، قد يعني قدر الطبيب على ملاحظة إشارات تحذيرية طفيفة على الشاشة الفرق بين اكتشاف سرطان مبكرًا أو تفويته. تطرح هذه الدراسة سؤالًا يهم أي مريض مستقبلي: عند تحليل مقاطع الفيديو الجراحية والتداخلية، كيف أداء أنظمة الذكاء الاصطناعي مقارنة بالأطباء، وما الذي يحدث عندما يعمل الاثنان معًا؟

فرض النظام على فيضان من فيديوهات الجراحة
الطب الحديث يسجل الآن أعدادًا هائلة من مقاطع الإجراءات، من تنظيرات الجهاز الهضمي إلى العمليات بمساعدة الروبوت. هذه التسجيلات غنية بالمعلومات: سلائل صغيرة في القولون، أورام مبكرة في المعدة أو المريء، أعصاب حساسة يجب تجنبها، أو خطوات في عملية معقدة. لقد درب الباحثون أنظمة الذكاء الاصطناعي على فحص هذه الصور ووضع علامات على المناطق المشبوهة وحتى التعرف على مواضع الجراحين داخل الإجراء. ومع ذلك، حتى الآن، قارنت معظم الدراسات الذكاء الاصطناعي بالأطباء في مواجهات اصطناعية وجهًا لوجه، بدلًا من السؤال عن كيفية استخدام التكنولوجيا بشكل واقعي — كمساعد إلى جانب الطبيب. هدفت هذه المراجعة إلى جمع وتحليل تلك الأدلة المتفرقة عبر اختصاصات متعددة بشكل منهجي.
ما الذي فحصه الباحثون
بحث الفريق في قواعد بيانات طبية وهندسية رئيسية وبدأوا بما يقرب من 38,000 ورقة. بعد تطبيق معايير صارمة — فقط الدراسات الأولية التي استخدمت الذكاء الاصطناعي على فيديوهات جراحية أو تداخلية حقيقية وقارنت أداءه مباشرة بأداء المتخصصين في الرعاية الصحية — تبقت 146 دراسة فقط. شملت هذه مجموعة واسعة من الإجراءات، خاصة تنظير الجهاز الهضمي، ولكن أيضًا تدخلات الرئة والغدة الدرقية والدماغ والقلب والمسالك البولية. استخدم معظمها أساليب التعلم العميق الحديثة، مثل الشبكات العصبية الالتفافية، المدربة على اكتشاف المرض، والتعرف على التشريح، وتقييم نظافة الأمعاء، أو تحديد خطوات العملية. أبلغت 76 من هذه الدراسات عن تفاصيل كافية سمحت للمؤلفين بتجميع النتائج وحساب مدى صحة أو خطأ الذكاء الاصطناعي والبشر.
الذكاء الاصطناعي بمفرده مقابل الأطباء، والذكاء الاصطناعي كزميل
عندما قارن الباحثون الذكاء الاصطناعي بالممارسين غير المدعومين الذين نظروا إلى نفس الفيديوهات، التقطت أنظمة الذكاء الاصطناعي عادةً مشكلات حقيقية أكثر (حساسية أعلى) دون التسبب في مزيد من الإنذارات الكاذبة (مقدار الممية مماثل). ظل هذا النمط ثابتًا سواء عندما اختُبرت النماذج على بيانات مألوفة أو عندما واجهت مجموعات بيانات خارجية جديدة. ومع ذلك، جاءت النتيجة الأكثر صلة سريريًا عندما استُخدم الذكاء الاصطناعي كمساعد. عبر مجموعة واسعة من المهام، كان الأطباء الذين اطلعوا على اقتراحات الذكاء الاصطناعي أفضل في اكتشاف المرض وأقل عرضة لتصنيف الأنسجة الطبيعية خطأً مقارنة بمن يعملون بمفردهم. كان هذا التعزيز بارزًا بشكل خاص لغير الخبراء، مثل المتدربين، الذين استفادوا أكثر من توجيه الذكاء الاصطناعي. بالنسبة للمتخصصين المخضرمين، أدى الدعم بالذكاء الاصطناعي والأداء الفردي للذكاء الاصطناعي إلى مستويات متقاربة إلى حد كبير، مما يشير إلى أنه في يد خبراء، يمكن أن يضاهي تعاون الإنسان والآلة أفضل الخوارزميات المستقلة.
فجوات بين ظروف المختبر والحياة الواقعية
رغم هذه الأرقام الواعدة، تبرز المراجعة فجوة بين كيفية اختبار الذكاء الاصطناعي حاليًا وكيف يجب أن يعمل في الإعدادات السريرية الحقيقية. قامت العديد من الدراسات بتنقية بياناتها بإزالة الإطارات الضبابية أو منخفضة الجودة، على الرغم من أن غرف العمليات وعيادات التنظير في الواقع تتعامل غالبًا مع مثل هذه العيوب بالذات. حلل آخرون لقطات معزولة بدلًا من فيديو متواصل، متجنبين تحدي متابعة الحركة والتوقيت. قلائل هم من قيموا الذكاء الاصطناعي في الوقت الحقيقي عند السرير، واعتمدت معظم الدراسات على معدات عالية الجودة قد لا تتوفر في المستشفيات محدودة الموارد. كانت ممارسات التقرير أيضًا متباينة: غالبًا ما كانت التفاصيل الأساسية حول كيفية ضبط النماذج والتحقق من صحتها مفقودة، مما يصعّب على الآخرين إعادة إنتاج النتائج أو تقييمها بإنصاف.

بناء شراكات إنسان-ذكاء اصطناعي موثوقة
يجادل المؤلفون بأن الذكاء الاصطناعي في الجراحة والطب التداخلي يجب أن يُطوَّر ويُختبر منذ البداية كشريك للأطباء، وليس كبديل. يعني ذلك تصميم دراسات تحاكي ظروف العالم الواقعي، ومشاركة مجموعات بيانات فيديو متنوعة عبر المراكز، واعتماد معايير تقرير واضحة حتى يتسنى للفرق الأخرى التحقق من العمل المنشور وتحسينه. يعني أيضًا تدريب الأطباء على فهم نقاط قوة الذكاء الاصطناعي وانحيازاته، بدلًا من الثقة العمياء أو الرفض التلقائي لاقتراحاته. بينما يظهر التحليل التلوي أن الذكاء الاصطناعي يمكنه بالفعل مضاهاة أو التفوق على أداء البشر غير المدعومين في العديد من المهام القائمة على الفيديو، فإن الفائدة الأكثر معنى تكمن في كيف يمكنه صقل الحكم البشري. بالنسبة للمرضى، الخلاصة ليست أن الآلات ستسيطر على غرفة العمليات، بل أن فرق الإنسان والذكاء الاصطناعي المصممة بعناية قد تجعل الإجراءات أكثر أمانًا، وتشخص الأمراض مبكرًا، وتحسن النتائج.
الاستشهاد: Rafati Fard, A., Williams, S.C., Smith, K.J. et al. Comparing artificial intelligence and healthcare professional performance in surgical and interventional video analysis: a systematic review and meta-analysis. npj Digit. Med. 9, 323 (2026). https://doi.org/10.1038/s41746-026-02401-2
الكلمات المفتاحية: الذكاء الاصطناعي في فيديو الجراحة, تنظير بمساعدة الحاسوب, تعاون الإنسان والذكاء الاصطناعي, تحليل الصور الطبية, دعم القرار السريري