Clear Sky Science · ar

أداء خوارزميات التنبؤ بمخاطر سرطان الثدي عبر أنظمة الماموغرام في برنامج الفحص البريطاني

· العودة إلى الفهرس

لماذا هذا مهم للنساء والأسر

يفيد فحص الثدي في إنقاذ الأرواح من خلال اكتشاف السرطانات مبكراً، ومع ذلك تظهر العديد من الأورام خلال السنوات بين الفحوص الدورية، وغالباً في مرحلة أكثر تقدماً. تطرح هذه الدراسة سؤالاً بسيطاً لكنه مهم: هل يمكن للذكاء الاصطناعي قراءة ماموغرام «طبيعي» والإشارة بهدوء إلى نساء في الواقع يواجهن مخاطر قصيرة الأجل عالية، حتى يُعرضن لفحوص إضافية قبل أن ينمو السرطان ويَنتشر؟

Figure 1
Figure 1.

رؤية ما هو أكثر في ماموغرام طبيعي

تدعو معظم برامج الفحص الوطنية، بما في ذلك البرنامج البريطاني، النساء لإجراء ماموغرام كل ثلاث سنوات. إذا لم يُلاحظ شيء مريب، يُعتبر الفحص «سلبيًا» وتعود المرأة إلى حياتها المعتادة. ومع ذلك، فإن حوالي 30% من سرطانات الثدي لدى النساء المَفحوضات هي «سرطانات بينية» تظهر بين الزيارات المجدولة وتميل إلى أن تكون ذات نتائج أقل إيجابية. مؤخراً، تعلمت أنظمة ذكاء اصطناعي قوية فحص صور ماموغرام تبدو طبيعية لقارئي البشر وتمنح كل امرأة درجة مخاطرة قصيرة الأجل. الفكرة هي استخدام هذه المعلومات الخفية لتفصيل تكرار الفحص ولتحديد من يجب أن يُعرض على اختبارات أكثر حساسية مثل الرنين المغناطيسي أو الماموغرام المعزز بالتباين.

اختبار أربعة أدوات ذكاء اصطناعي

فحص الباحثون 112,621 صورة ماموغرام فحصية سلبية من موقعين تابعين لبرنامج فحص الثدي في NHS في إنجلترا، شاملة جولة كاملة مدتها ثلاث سنوات من 2014 إلى 2017 ومتابعة النساء لمدة خمس سنوات. استخدم الموقعان أجهزة ماموغرام رقمية مختلفة (فيليبس وGE)، مما يعكس التباين في العالم الحقيقي. خلال فترة المتابعة، طورت 1,225 امرأة سرطان ثدي، بما في ذلك 396 حالة سرطان بيني وغيرها من السرطانات التي وُجدت في جولة الفحص التالية. شُغلت أربعة خوارزميات رائدة لتقدير المخاطر — ثلاث تجارية ونموذج أكاديمي واحد — محلياً على كل صورة ماموغرام لتوليد درجة مخاطرة مستقبلية، وقورنت آداءاتها.

مدى قدرة الخوارزميات على كشف السرطانات المستقبلية

امتلكت جميع أنظمة الذكاء الاصطناعي الأربعة قدرة على التمييز، أفضل من الصدفة، بين النساء اللواتي سيطورن سرطاناً واللواتي لن يطورنه، لكنها لم تؤدِّ بنفس الجودة. أظهرت خوارزمية واحدة (الموسومة DL‑1) أداءً قوياً باستمرار، في حين تأخرت أخرى (DL‑3). عندما ركز الفريق على السرطانات البينية — تلك التي تظهر قريباً بعد فحص «طبيعي» — وصلت أفضل النماذج إلى مستويات دقة مشابهة أو أفضل من دراسات سابقة لنموذج واحد. والأهم من ذلك، أن ثلاثاً من الأدوات الأربع كانت تعمل بشكل مشابه على صور فيليبس وGE، مما يشير إلى قدرتها على التعامل مع بعض اختلافات أجهزة المسح، رغم أن خوارزمية واحدة آداءها كان أسوأ بصورة ملحوظة على نظام واحد.

ماذا يحدث إذا تحركنا بناءً على أعلى درجات المخاطرة؟

السؤال العملي لخدمات الفحص هو كم عدد النساء اللواتي يجب استدعاؤهن بناءً على درجات الذكاء الاصطناعي. لذلك درس الباحثون نقاط قطع ذات معنى سريري. إذا تم اختيار أعلى 4% فقط من النساء الأعلى مخاطرة (حسب درجات كل أداة) للحصول على اهتمام إضافي، التقطت أفضل أداتين معاً نحو واحدة من كل خمس حالات سرطان مستقبلية وأكثر من ربع السرطانات البينية. عندما رُخِّص العتبة لتشمل أعلى 14% من درجات المخاطرة — وهو أقرب إلى معدلات الاستدعاء المرصودة في بعض البرامج بأمريكا الشمالية — تضاعفت العائدات تقريباً: حدد أقوى نموذج نحو 42% من جميع السرطانات المستقبلية ونحو نصف السرطانات البينية. ومع ذلك، كانت كل خوارزمية تميل إلى تمييز مجموعة مختلفة جزئياً من السرطانات، مع تداخل قليل نسبياً، مما يوحي أن الجمع بين النماذج أو استراتيجيات متعددة الأدوات قد يكتشف أوراماً أكثر من أي نموذج منفرد.

Figure 2
Figure 2.

نقاط القوة والثغرات والخطوات التالية

تتميز هذه الدراسة باستخدام بيانات روتينية كاملة من مركزين كبيرين لفحص NHS بدلاً من عينة بحثية محددة ضيّقاً، كما أنها الأولى التي تقيم عدة أدوات مخاطرة معروفة جنباً إلى جنب في السياق البريطاني. وفي الوقت نفسه، ثَمَّة قيود. استُبعدت النساء الحاصلات على غرسات أو اللواتي خضعن لزوايا تصوير غير قياسية، وشملت الدراسة علامتي ماموغرام فقط، لذا يبقى الأداء على أجهزة أخرى أو عبر مجموعات عرقية مختلفة غير مؤكد. وبما أن التحليل كان استعاديًا، فبعض السرطانات التي كان من الممكن اكتشافها مبكراً بفحوص إضافية معتمدة على المخاطر لم تُحتسب، ما يعني أن الفائدة الحقيقية قد تكون أكبر مما ورد.

ماذا يعني هذا لفحص الثدي في المستقبل

للقارئ العام، الخلاصة أن الذكاء الاصطناعي الحديث يمكنه بالفعل اكتشاف علامات تحذيرية في ماموغرامات «طبيعية» تتنبأ أي النساء أكثر عرضة لتطوير سرطان الثدي قريباً، لا سيما السرطانات البينية التي يصعب اكتشافها مبكراً. من حيث المبدأ، قد تسمح أفضل الخوارزميات لبرامج الفحص أن تعرض فحوصاً أكثر تكراراً أو أكثر حساسية لمجموعة صغيرة نسبياً من النساء ذات المخاطر الأعلى، بينما تتابع الأخريات فحوص الثلاث سنوات الاعتيادية. ومع ذلك، تُظهر الفروقات بين الأدوات وبين أنظمة التصوير أن أياً من نماذج الذكاء الاصطناعي وحده غير جاهز للتبني الشامل دون اختبار دقيق. ويطالب المؤلفون بإجراء تجارب مستقبلية واسعة النطاق تستخدم عدة خوارزميات، إلى جانب ضبط دقيق لأجهزة السكان المحليين، قبل أن يصبح الفحص القائم على المخاطر الموجه بالذكاء الاصطناعي رعاية روتينية آمنة.

الاستشهاد: Rothwell, J., Payne, N., Kilburn-Toppin, F. et al. Performance of breast cancer risk prediction algorithms across mammography systems in the UK screening programme. npj Digit. Med. 9, 330 (2026). https://doi.org/10.1038/s41746-026-02507-7

الكلمات المفتاحية: فحص سرطان الثدي, الذكاء الاصطناعي, الماموغرام, التنبؤ بالمخاطر, سرطانات بينية