Clear Sky Science · ar
GPT-4o لتحديد فحوصات المتابعة تلقائياً استنادًا إلى تقارير الأشعة من الممارسة السريرية الروتينية
لماذا تهم فحوصات المتابعة الأذكى
عندما يخضع المريض لفحص تصوير مقطعي محوسب أو رنين مغناطيسي، لا تنتهي القصة عند الصور فحسب. يجب على أطباء الأشعة أيضًا أن يقرروا ما إذا كانت هناك حاجة لفحوصات متابعة ومتى يتم إجراؤها لمراقبة الأورام، وفحص البقع المشبوهة، أو التأكد من فعالية العلاج. يمكن أن تعني هذه الخيارات الفرق بين اكتشاف المرض مبكرًا وتعريض المرضى لإشعاع وتكاليف وقلق غير ضروريين. طرحت هذه الدراسة سؤالًا ملحًا: هل يمكن لنظام ذكاء اصطناعي حديث، GPT-4o، أن يساعد على توحيد قرارات المتابعة بحيث يحصل المرضى على رعاية متسقة قائمة على الإرشادات؟

مشكلة الرسائل المتضاربة
تنشر الجمعيات المهنية توصيات مفصّلة حول متى وكيفية إعادة التصوير للعديد من السرطانات والاكتشافات العرضية. ومع ذلك، في الممارسة اليومية، كثيرًا ما يختلف أطباء الأشعة بشأن المتابعة. بعضهم يحرص على طلب فحوصات تكرارية بسرعة؛ والبعض الآخر يتسم بحذر أكبر. أظهرت بحوث سابقة أن احتمال التوصية بتصوير إضافي يمكن أن يتفاوت بنحو سبعة أضعاف بين أطباء أشعة ينظرون إلى حالات مماثلة. العديد من الخطط المقترحة لا تتطابق بالكامل مع الإرشادات المنشورة، ما يؤدي ببعض المرضى إلى الخضوع لمزيد من الفحوصات دون داعٍ، بينما قد يفوت آخرون فحوصات مهمة في الوقت المناسب. هذا التباين يدفع إلى تطوير أدوات يمكنها توجيه الممارسة بلطف نحو قرارات أكثر اتساقًا ومبنية على الأدلة.
كيف صُممت الدراسة
اختبر الباحثون GPT-4o، وهو نموذج لغة كبير مصمم لفهم النصوص وتوليدها، على 100 حالة أشعة حقيقية من مستشفيين ألمانيين. شملت جميع الحالات بالغين خضعوا لتصوير مقطعي محوسب أو رنين مغناطيسي لأسئلة متعلقة بالسرطان في أربعة مناطق رئيسية: الرأس والرقبة، والكبد، والرئة، والبنكرياس. لكل حالة، تلقى النموذج التقرير المكتوب الكامل، بما في ذلك التاريخ الطبي ونتائج الفحص وخلاصة أخصائي الأشعة. طُلب من GPT-4o أداء مهمة واحدة: استنادًا إلى هذه المعلومات، اقترح طريقة المتابعة التصويرية الدقيقة (مثل CT أو MRI) وزمن الفحص التالي. أجاب مقيم أشعة وطبيب أشعة مخضرم معتمد على نفس السؤال لكل حالة.
قياس الجودة مقابل الإرشادات
لحكم هذه التوصيات، قارن اثنان من أطباء الأشعة البارزين، اللذان لم يعرفا مصدر الاقتراحات، جميع الإجابات مع الإرشادات الدولية الرئيسية من جمعيات السرطان والأشعة. قيّما كل اقتراح من أربعة جوانب: ما إذا كانت جميع النتائج ذات الصلة التي تحتاج إلى متابعة مغطاة، ما إذا كانت تقنية التصوير المختارة مناسبة، مدى دقة التوقيت المقترح، وتقييم جودة عام على مقياس من خمس نقاط. في جوهرها، كان السؤال الذي طرحه الخبراء هو: هل يحافظ هذا الخطة على سلامة المريض، وتلتزم بالقواعد، وتتجنب الفحوصات غير الضرورية؟

كيف قاوم الذكاء الاصطناعي المقارنة مع البشر
عبر جميع الحالات المئة، امتدت جودة توصيات المتابعة من GPT-4o لتوازي جودة طبيب الأشعة المخضرم وتفوق المقيم. كان الوسيط لتقييم الجودة العامة للنموذج 4 من 5، مماثلًا بشكل أساسي للخبير وبفارق مهم عن المتدرب. حصل GPT-4o على التوقيت الصحيح كليًا أو جزئيًا في 96% من الحالات، متفوقًا على المقيم (75%) ومتقدمًا قليلًا على الخبير (90%). كما أنتج أقل عدد من الأخطاء المحتملة في التوقيت التي قد تكون ضارة. غطى النموذج جميع النتائج التي احتاجت متابعة في 92% من الحالات، وهو رقم مشابه للمقيم وبمقياس محدد كان أفضل بوضوح من الخبير. في اختيار نوع الفحص الصحيح، أدّى GPT-4o تقريبا بمستوى مماثل لكلا القارئين البشريين. كانت أقوى مجالاته في تصوير الرئة والكبد والبنكرياس، حيث تكون مسارات الإرشاد موحدة بشكل خاص؛ وكان الأداء أقل قليلًا، لدى جميع المقارئين، في منطقة الرأس والرقبة الأكثر تعقيدًا.
ماذا قد يعني هذا للرعاية المستقبلية
تشير الدراسة إلى أن GPT-4o يمكن أن يعمل كمساعد موثوق لقرارات تصوير المتابعة، بعمله على مستوى قريب من طبيب أشعة مخضرم وفي العديد من النواحي أفضل من المتدرب. عند استخدامه كأداة دعم اتخاذ قرار بدلاً من بديل، يمكن لمثل هذا النظام أن يساعد في تقليل الفحوصات غير الضرورية، وخفض التأخيرات في المتابعة الضرورية، وتخفيف عبء العمل على أقسام الأشعة المزدحمة، مع الحفاظ على الممارسة أقرب إلى الإرشادات المعتمدة. ومع ذلك، يؤكد المؤلفون أن الخبراء البشريين يجب أن يظلوا مسؤولين: لا يزال بإمكان النموذج تفسير التقارير بشكل خاطئ، وآلياته الداخلية غير شفافة، وشملت الدراسة فقط 100 حالة متعلقة بالسرطان من مركزين. ستكون هناك حاجة إلى تجارب أكبر مستقبلية وخضوعية ونشرات آمنة محلية قبل أن يمكن دمج مثل هذه الأدوات بأمان في سير العمل السريري اليومي.
الاستشهاد: Kaya, K., Müller, L., Persigehl, T. et al. GPT-4o for Automated Determination of Follow-up Examinations Based on Radiology Reports from Clinical Routine. Sci Rep 16, 12587 (2026). https://doi.org/10.1038/s41598-026-40317-9
الكلمات المفتاحية: متابعة الأشعة, نماذج اللغة الكبيرة, دعم اتخاذ القرار الطبي, تصوير الأورام, GPT-4o