Clear Sky Science · ar

نماذج أساسية متخصِّصة لغرف العمليات الذكية

· العودة إلى الفهرس

مساعدة أكثر ذكاءً في غرفة العمليات

تُجرى الجراحة الحديثة في بيئة مزدحمة ومجهزة بتقنيات عالية حيث يجب أن يعمل الأشخاص والروبوتات والكاميرات والشاشات معًا دون أخطاء. يعرض هذا المقال ORQA، نوعًا جديدًا من الذكاء الاصطناعي مصمَّم خصيصًا لغرفة العمليات. بخلاف الدردشات الآلية الشائعة التي تتعامل أساسًا مع الكلمات والصور البسيطة، بُني ORQA ليُشاهِد ويستمع ويُفسِّر كل ما يحدث أثناء الجراحة بحيث يدعم الفرق، ويرصد المخاطر، ويسهم في جعل العمليات أكثر أمانًا.

Figure 1
Figure 1.

لماذا يصطدم الذكاء الاصطناعي الحالي بصعوبات في الجراحة

الكثير من أدوات الذكاء الاصطناعي التي أثارت إعجاب العالم تم تدريبها على صور وفيديوهات ونصوص من الإنترنت. يمكنها تفسير مصطلحات طبية أو وصف عملية شائعة، لكن العالم البصري داخل غرفة العمليات مختلف جدًّا. تعرض كاميرات متعددة زوايا متداخلة، وتتحرك أذرع روبوتية قرب الأشخاص، وتكون الأدوات صغيرة ولامعة، وتتزامن أحداث كثيرة في آن واحد. كثيرًا ما تفوّت نماذج الذكاء العام التفاصيل الحرجة: قد تكتشف وجود جراح لكنها تفشل في تحديد أداة محددة، أو توقُّع الخطوة المقبلة لروبوت، أو التعرف على انتهاك مناطق التعقيم. عندما اختبر المؤلفون أنظمة الرؤية-اللغة الرائدة، بما في ذلك نماذج تجارية ونموذج مفتوح المصدر قوي، كان أداؤها في مهام جراحية أفضل قليلًا من التخمين بناءً على أكثر إجابة شائعة.

تحويل تسلسل العمل الجراحي إلى أسئلة وأجوبة

لقياس وفهم الجراحة آليًا وتحسينه بشكل منهجي، أنشأ الباحثون معيار ORQA. جمعوا أربعة مجموعات بيانات غنية من غرف عمليات حقيقية ومحاكاة تتضمن عروض كاميرات خارجية، فيديو مثبت على الجراح، إعادة بناء للمشهد ثلاثي الأبعاد، صوتًا، سجلات روبوت، وغير ذلك. من هذه المصادر أنشأوا أكثر من مئة مليون زوج سؤال-إجابة حول ما يجري في الغرفة. تغطي هذه الأسئلة 23 نوعًا من المهام، مثل عدد الأشخاص الحاضرين، أي الأدوات قيد الاستخدام، ما الإجراء الجاري، أين توجد أداة في الفضاء ثلاثي الأبعاد، ما إذا كان هناك خرق للتعقيم، وما هي الخطوة التالية للروبوت. وباختصار هذه المجموعة الضخمة إلى مليون مثال متنوِّع للتدريب ومجموعات منفصلة للاختبار، أنشأوا معيارًا موحدًا لأي نموذج ذكاء يدّعي فهم الجراحة.

نموذج أساسي مصمم لغرفة العمليات

باستخدام هذا المعيار، درّب الفريق ORQA، نموذجًا أساسيًا متخصِّصًا يجمع تيارات متعددة من بيانات الجراحة. تتعامل مشفِّرات منفصلة مع إطارات الفيديو، سُحب النقاط ثلاثية الأبعاد، الصوت، نصوص الكلام، بيانات قياس الروبوت، وبيانات التتبُّع، محوِّلة إياها إلى تمثيل عددي مشترك. ثم يقوم نموذج لغوي كبير بالتفكير فوق هذا الإشارة المدمجة للإجابة على أسئلة حول المشهد. على معيار ORQA، ضاعف هذا النظام المُكيّف مع المجال أداء النماذج العامة، وفعل ذلك عبر نطاق واسع من المهام — التعرف على الأفعال، تحديد مواقع الأدوات، الاستدلال حول المسافات والأدوار، والتحقق من حالات متعلقة بالسلامة. ويمكن توسيع النموذج بهياكل ذاكرة تتعقّب كيف تطور الإجراء بمرور الوقت، مما يشير إلى مكاسب مستقبلية من نمذجة زمنية أغنى.

Figure 2
Figure 2.

جعل الذكاء الجراحي سريعًا وعمليًا

غالبًا ما تكون النماذج القوية كبيرة جدًا للاستخدام الفوري داخل المستشفيات، حيث قد تكون الحواسب صغيرة واتصالات الشبكة إلى خوادم بعيدة مقيدة لأسباب تتعلق بالخصوصية. لمعالجة ذلك، استخدم المؤلفون عملية اسمها التقطير، حيث يدرب نموذج "معلم" كبير نسخًا أصغر "طلابية". أنتجوا ثلاث نسخ مدمجة من ORQA تعمل أسرع عدة مرات مع الحفاظ على معظم الدقة الأصلية. يمكن لهذه النماذج الأخف تشغيلًا محليًا على بطاقة رسومية واحدة أو جهاز طرفي، مما يتيح مراقبة محطات متعددة في غرفة العمليات في وقت واحد ويتجنب الحاجة إلى بث بيانات حساسة للمرضى إلى السحابة. كما أن المخرجات المهيكلة والقابلة للتتبع — مثل قوائم الأشخاص والأدوات وتفاعلاتهم — تُسهّل على الممارسين التحقق من سلوك النظام وتدقيقه وثقتهم به.

ماذا يعني هذا لمستقبل الجراحة

بعبارة بسيطة، تُظهر الدراسة أن الجراحة تحتاج إلى نوعها الخاص من الذكاء الاصطناعي، المدرب مباشرة على مناظر وأصوات العمليات الحقيقية بدلًا من محتوى الويب العام. يبرهن ORQA أنه عندما يتعرَّض النموذج لبيانات جراحية متعددة الوسائط الصحيحة، يمكنه تتبُّع من يفعل ماذا بشكل موثوق، وأين الأدوات موجودة، وكيف يتقدم الإجراء، وما إذا كان قد يحدث شيء غير آمن. وبينما يبقى الكثير من العمل قبل أن تتمكن مثل هذه الأنظمة من توجيه الجراحة مباشرة، يوفر ORQA ومعياره أساسًا لمساعدين أكثر ذكاءً، وتوثيقٍ أفضل، وفي نهاية المطاف غرف عمليات أكثر استقلالية وتنسيقًا.

الاستشهاد: Özsoy, E., Pellegrini, C., Bani-Harouni, D. et al. Specialized foundation models for intelligent operating rooms. npj Digit. Med. 9, 362 (2026). https://doi.org/10.1038/s41746-026-02631-4

الكلمات المفتاحية: الذكاء الاصطناعي الجراحي, غرفة العمليات, نماذج متعددة الوسائط, الروبوتات الطبية, سلامة المرضى