Clear Sky Science · ar

دقة التشخيص والإنصاف والتنفيذ الإكلينيكي للذكاء الاصطناعي في فرز سرطان الثدي: نتائج دراسات فنية متعددة المراكز استعادية ومبدئية

· العودة إلى الفهرس

فرز أذكى للنساء في حياتهن اليومية

يفيد فرز سرطان الثدي في إنقاذ الأرواح، لكنه يثقل أيضاً على نظم الرعاية الصحية وقد يفوّت بعض الأورام أو يطلق إنذارات كاذبة مقلقة. تطرح هذه الدراسة سؤالاً بسيطاً ذو آثار واسعة: هل يمكن لبرنامج ذكاء اصطناعي أن يساعد بأمان في قراءة الماموغرامات داخل برنامج الفرز الوطني بالمملكة المتحدة، ليكشف مزيداً من الأورام الخطرة بينما يخفف ضغط العمل على الأخصائيين المشغولين—وبشكل عادل للنساء من خلفيات مختلفة؟

Figure 1
Figure 1.

كيف يعمل الفرز اليوم

في العديد من البلدان، بما في ذلك المملكة المتحدة، تُدعى النساء اللاتي تتراوح أعمارهن بين 50 و70 لإجراء ماموغرامات دورية. في المملكة المتحدة، يتم عادةً قراءة كل فحص بشكل مستقل بواسطة خبيرين بشريين؛ وإذا اختلَف رأيهما، تراجع لجنة الحالة. صُمِّم هذا النظام ثنائي القراءة ليكون آمناً، لكنه يحتاج وقتاً ويعتمد على وجود عدد كافٍ من القُرّاء المدربين—وهو أمر تعاني منه كثير من أنظمة الرعاية الصحية. قدمت الأدوات الحاسوبية السابقة مساعدة محدودة وأحياناً أضافت ضوضاء بدلاً من الوضوح، لذلك طالبت السلطات الصحية بأدلة قوية قبل أن تثق بالتقنيات الحديثة للذكاء الاصطناعي داخل البرامج الوطنية.

اختبار الذكاء الاصطناعي في العيادات الحقيقية

قيَّم الباحثون نسخة محدثة من ذكاء غوغل للماعوجرامفي مرحلتين رئيسيتين عبر هيئة الخدمات الصحية الوطنية في المملكة المتحدة. أولاً، شغّلوا النظام على ما يقرب من 116000 فحص فرز سابق من خمس مناطق مختلفة، وتابعوا النساء لأكثر من ثلاث سنوات لمعرفة الأورام التي ظهرت فعلاً. ثم قارَنوا أداء الذكاء الاصطناعي بأداء القارئ البشري الأول، والقارئ الثاني، وقرار اللجنة النهائية. في المرحلة الثانية، ركّبوا الذكاء الاصطناعي بهدوء في 12 موقع فرز وجعلوه يعالج أكثر من 9000 فحص جديدة في الزمن الحقيقي—دون أن يؤثر على الرعاية—لدراسة سلوكه في العمل اليومي وكيفية الحاجة لضبط إعداداته.

ما رآه الذكاء الاصطناعي—وما اكتشفه

عبر مجموعة البيانات الاستعادية الكبيرة، كان الذكاء الاصطناعي أكثر حساسية من القارئ البشري الأول: التقط مزيداً من السرطانات عموماً مع الحفاظ على معدل الإنذارات الكاذبة ضمن هامش أمان محدد سلفاً. إذا استُخدم كأحد القُرّاء في سير العمل ثنائي القراءة، لكان النظام قد رفع معدل اكتشاف السرطان من نحو 7.5 إلى 9.3 حالات لكل 1000 امرأة، كما أنه علّم بشكل صحيح واحداً من كل أربعة سرطانات كانت قد أُخِفِيت في الأصل واُكتشِفت لاحقاً، إما بين الجولات أو عند الزيارة الروتينية التالية. كانت الزيادات أقوى بشكل خاص لدى النساء اللواتي جئن لإجراء الفحص لأول مرة—وهي عادةً أصعب مجموعة للتفسير لأن لا توجد صور سابقة. في هذه الزيارات الأولى، استدعى الذكاء الاصطناعي عدداً أقل من النساء وأيضاً اكتشف عددًا قليلًا أكثر من السرطانات، لاسيما الأورام الغازية التي تشكل أكبر خطر.

الإنصاف والعبء العملي والعقبات الواقعية

فحص الفريق بعناية ما إذا كان الذكاء الاصطناعي يعامل مجموعات النساء المختلفة بعدالة. عبر العمر وكثافة الثدي والوضع الاجتماعي والاقتصادي والبيانات المحدودة المتاحة عن العرق، لم يروا علامات ثابتة على تحيز ضار: ظلت الحساسية والنوعية ضمن هوامش ضيقة مقارنة بالقُرّاء البشر، رغم أن بعض المجموعات الفرعية الصغيرة جداً كان لديها عدم يقين واسع. كما نمذجوا كيف سيُعيد استخدام الذكاء الاصطناعي كقارىء ثانٍ تشكيل عبء العمل. قد يقل عدد قراءات البشر قبل مراجعة اللجنة بما يقرب من النصف، ما يختصر وقت القارئ بنحو ثلث، رغم أن مزيداً من الحالات سترتقى إلى اللجنة. في مرحلة القياس الحيّة، سلّم الذكاء الاصطناعي النتائج خلال دقائق—أسرع بكثير من القراءة البشرية الروتينية—لكن الفريق اكتشف تغيراً في كيفية ظهور الصور الحديثة مقارنة ببيانات التدريب الأقدم. ثبت أن عتبة التشغيل الأولية كانت حساسة للغاية، مما تسبب في معدلات استدعاء أعلى، واضطروا لإعادة معايرتها إلى الأسفل باستخدام بيانات محلية جديدة.

Figure 2
Figure 2.

بناء نظام فرز جاهز للذكاء الاصطناعي

إلى جانب الدقة، كشفت الدراسة عن حواجز عملية أمام النشر الآمن. لا تزال العديد من مراكز الفرز تعتمد على النماذج الورقية وبرمجيات قديمة لا تستطيع تخزين نتائج الذكاء الاصطناعي تلقائياً أو شرح سبب استدعاء فحص—وهي ميزات يحتاجها المنظمون والأطباء. يجادل المؤلفون بأن سير عمل رقمي كامل وموحد وجمع أفضل للبيانات الديموغرافية سيكونان حاسمين لمراقبة الأداء والإنصاف مع مرور الوقت. كما يؤكدون أن عتبات الذكاء الاصطناعي لا يمكن أن تُحدد وتُنسى: معدات التصوير وسلوك القراء وتشكيلة السكان كلها تتغير، لذا يجب فحص النظام باستمرار وضبطه، مع قواعد وطنية واضحة ودعم تقني.

ما الذي يعنيه هذا للمرضى

تشير النتائج إلى أن نظام ذكاء اصطناعي منشَّط بعناية يمكن أن يساعد برامج الفرز الوطنية لسرطان الثدي على اكتشاف مزيد من السرطانات الخطيرة مبكراً، خصوصاً لدى النساء اللواتي يحضرن لفحص الماموغرام لأول مرة، بينما يخفف عبء العمل عن الأخصائيين المرهقين. ومع ذلك يؤكد المؤلفون أن النجاح يعتمد على أكثر من خوارزمية دقيقة. ستحتاج خدمات الصحة إلى معايرة مستمرة، ورقابة صارمة على الانحراف والتحيّز، وبنية تحتية تقنية معلومات محدثة وتكامل مدروس مع سِير العمل البشري القائمة. مع توفر هذه الضمانات، يمكن أن يصبح الذكاء الاصطناعي قارئاً إضافياً موثوقاً يحسن كلّاً من كفاءة وإنصاف فرز سرطان الثدي بدلاً من أن يكون صندوقاً أسود يضيف مخاطر جديدة.

الاستشهاد: Kelly, C.J., Wilson, M., Warren, L.M. et al. Diagnostic accuracy, fairness and clinical implementation of AI for breast cancer screening: results of multicenter retrospective and prospective technical feasibility studies. Nat Cancer 7, 494–506 (2026). https://doi.org/10.1038/s43018-026-01127-0

الكلمات المفتاحية: فرز سرطان الثدي, الذكاء الاصطناعي الطبي, التصوير الشعاعي للثدي (الماموغرام), إنصاف الرعاية الصحية, التنفيذ الإكلينيكي