Clear Sky Science · ar
تحليل مقارن لنماذج معتمدة على البيانات لتنبؤ النجاة من سرطان الثدي
لماذا تهم هذه الدراسة صحة النساء
أصبح سرطان الثدي الآن أكثر أنواع السرطان تشخيصًا بين النساء على مستوى العالم، وفي البلدان ذات الموارد الطبية المحدودة غالبًا ما يُكتشف في مراحل متأخرة ويُعالج في ظروف صعبة. تركز هذه الدراسة على النساء في إثيوبيا وتطرح سؤالًا يتعلق بالحياة أو الموت: بالنظر إلى المعلومات التي يجمعها الأطباء بالفعل عن المريضة، هل يمكن للأدوات الحديثة المعتمدة على البيانات أن تتنبأ بدقة أكبر بمن هم الأكثر عرضة للوفاة بسبب سرطان الثدي؟ قد تساعد توقعات أدق الأطباء على إعطاء أولوية للعلاجات المحدودة، وتحديد مواعيد متابعة أقرب للمرضى الأكثر ضعفًا، وإعطاء النساء معلومات أوضح حول توقعات سير المرض.
النساء والمستشفيات والسجلات الطبية اليومية
حلل الباحثون سجلات طبية لـ 1,164 امرأة عولجن من سرطان الثدي بين عامي 2019 و2024 في مستشفيين رئيسيين بإثيوبيا. لكل امرأة، تتبعوا مدة بقائها على قيد الحياة بعد التشخيص وما إذا توفيت خلال فترة المتابعة أم لا تزال على قيد الحياة عند انتهاء جمع البيانات. إلى جانب هذه النتيجة، استخدموا معلومات سريرية واجتماعية شائعة تقوم المستشفيات بتسجيلها روتينيًا: العمر، حجم الورم، مرحلة السرطان، ما إذا كان السرطان قد انتشر إلى أعضاء بعيدة (انبثاث) أو لعُقد لمفاوية، وجود أمراض أخرى، الحالة الاجتماعية، عادات نمط الحياة مثل التدخين أو تعاطي القات، وما إذا كانت المرأة قد أرضعت. كل هذه تفاصيل يمكن جمعها دون اختبارات مكلفة، مما يجعل أدوات التنبؤ الناتجة واقعية للبيئات ذات الموارد المحدودة.

طرق قديمة وجديدة لقراءة فرص البقاء
تقليديًا، يستخدم الأطباء والإحصائيون طرق تحليل البقاء مثل منحنيات كابلان–ماير ونموذج كوكس للمخاطر النسبية لفهم مدة بقاء المرضى مع المرض والعوامل التي تؤثر في تلك المدة. هذه الطرق سهلة التفسير نسبيًا لكنها تواجه صعوبة عندما تتفاعل العديد من العوامل بطرق معقدة وغير خطية، كما يحدث غالبًا في رعاية السرطان الواقعية. قارن المؤلفون هذه الأساليب الكلاسيكية بنماذج تعلم آلي أكثر مرونة، بما في ذلك غابات البقاء العشوائية ونماذج البقاء المعتمدة على التعلم العميق، وكذلك أدوات التصنيف القياسية مثل آلات الدعم الناقل، الغابات العشوائية، XGBoost، وLightGBM. تدربت كل النماذج على جزء من البيانات واختُبرت على حالات غير مرئية، وقُيم أداؤها بمقاييس تلتقط كلًا من قدرتها على ترتيب المرضى حسب الخطر ومدى تطابق أوقات البقاء المتوقعة مع الواقع.
ما هي العوامل التي تشكل البقاء أكثر؟
عبر المجموعة بأكملها، برزت عدة أنماط حتى قبل تطبيق النماذج المتقدمة. كانت النساء ذوات الأورام الأكبر، وتورط عدد أكبر من العقد اللمفاوية، أو السرطان المنتشر لديهن نتائج بقاء أسوأ بكثير. كانت اللاتي تم تشخيصهن في المرحلة الرابعة أكثر عرضة للوفاة خلال المتابعة، بينما كانت نتائج النساء ذوات المرحلة الأولى أفضل بكثير. زاد العمر خصوصًا عند 45 سنة وما فوق، ووجود أمراض أخرى مثل الأمراض المزمنة، من سوء البقاء. ارتبطت عادات نمط الحياة مثل التدخين أو تناول الكحول أو القات بنتائج أسوأ أيضًا. وُجد أن النساء المتزوجات كن تميلن إلى البقاء أطول من العازبات أو المطلقات أو الأرامل، وهو ما يتماشى مع نتائج من دول أخرى تشير إلى أن الدعم الاجتماعي يمكن أن يحسن بقاء مرضى السرطان بمساعدتهم على الاستمرار في الرعاية.

ما الذي أضافته الخوارزميات الذكية إلى الصورة
عند مقارنة النماذج، قدمت غابات البقاء العشوائية—وهي طريقة تنشئ العديد من أشجار القرار المخصصة للبقاء وتجمع نتائجها—أدق التنبؤات بمدة حياة المرضى. وكانت طريقة ذات صلة قريبة، وهي الغابات العشوائية المستخدمة كمصنِّف، الأفضل في تمييز النساء ذوات المخاطر الأعلى عن الأقل. لتفادي مشكلة "الصندوق الأسود"، استخدم الباحثون تقنية تُسمى SHAP لمعرفة العوامل التي اعتمدت عليها النماذج أكثر. عبر أقوى النماذج، برزت نفس الخصائص في القمة: العمر، حجم الورم، الانبثاث، تورط العقد اللمفاوية، المرحلة العامة، ووجود أمراض أخرى. ساهمت السمات الاجتماعية مثل الحالة الاجتماعية وبعض العادات أيضًا، لكن بدرجة أقل. عمليًا، تعلمت النماذج وكَوَّنت قيماً رقمية لنفس إشارات الخطر الرئيسية التي يقلق بشأنها الأطباء، مع وزنها أيضًا لكيفية تداخلها بطرق دقيقة.
ماذا يعني هذا للمرضى والعيادات
تستنتج الدراسة أنه بالنسبة للنساء الإثيوبيات المصابات بسرطان الثدي، يمكن أن توفر نماذج البقاء المعتمدة على البيانات والمصممة لتنبؤ وقت الوفاة—وخاصة غابات البقاء العشوائية—تقديرات مخاطر أكثر دقة ومعقولة التفسير مقارنة بالأساليب التقليدية وحدها. وبما أن هذه النماذج تستخدم معلومات تُجمع بالفعل في الرعاية الروتينية، فيمكن إدماجها في أدوات بسيطة تميِّز المرضى ذوي المخاطر العالية، وتساعد الأطباء على تقرير من يحتاج إحالة أسرع أو علاجًا أكثر كثافة، وتوجه محادثات صريحة لكنها مخصصة حول التشخيص. ومع أن العمل له حدود—فلم يتضمن بيانات جينية أو صورًا واعتمد على سجلات تاريخية—فإنه يبيِّن أن تطبيق تعلم الآلة بعناية يمكن أن يحول بيانات المستشفيات العادية إلى دعم عملي لرعاية السرطان في بيئات مقيدة الموارد.
الاستشهاد: Takele, K., Chen, DG. A comparative analysis of data-driven models for breast cancer survival prediction. Sci Rep 16, 10114 (2026). https://doi.org/10.1038/s41598-026-40565-9
الكلمات المفتاحية: نجاة سرطان الثدي, تعلم الآلة, غابة البقاء العشوائية, إثيوبيا, عوامل الخطر السريرية