Clear Sky Science · ar
نموذج تعلم عميق مضبوط هجين لتشخيص سرطان الثدي باستخدام البيانات الجينية
لماذا يهم هذا المرضى والعائلات
أصبح سرطان الثدي الآن أكثر أنواع السرطان تشخيصًا بين النساء على مستوى العالم، والاكتشاف المبكر يمكن أن يفرق بين الحياة والموت. بات الأطباء يملكون بشكل متزايد معلومات جينية عن الشخص، لكن تحويل عشرات الآلاف من قياسات الجينات إلى إجابات واضحة أمر بالغ الصعوبة. تصف هذه الورقة نموذجًا حاسوبيًا جديدًا يقرأ هذه الأنماط الجينية المعقدة لرصد سرطان الثدي والتنبؤ بالنتائج بدقة لافتة، مما قد يمنح الأطباء مساعدًا قويًا لاتخاذ قرارات مبكرة وأكثر موثوقية.
من الجينات إلى إشارات التحذير
يحمل كل ورم ثديي بصمة جزيئية مشفرة في نشاط آلاف الجينات. سعى المؤلفون إلى بناء نظام يمكنه قراءة هذه البصمة مباشرة، بدلاً من الاعتماد فقط على الصور أو على مجموعة صغيرة من الجينات المعروفة مثل BRCA1 وBRCA2. عملوا مع اثنين من أكبر المصادر العامة في علم جينوم السرطان: مجموعة TCGA لسرطان الثدي، التي تتضمن نشاطًا لـ 17,814 جينًا في 590 عينة، ودراسة METABRIC، التي تحتوي على معلومات جينومية وسريرية لأكثر من 1,400 مريض. كان هدفهم طموحًا: تصميم طريقة قادرة على التعامل مع هذا الفيضان من المعلومات، واكتشاف الإشارات الأكثر دلالة، والعمل بشكل موثوق في مجموعات مرضى منفصلة تمامًا.

تكثيف آلاف الجينات إلى مجموعة مفيدة
إن النظر إلى ما يقرب من ثمانية عشر ألف جين مرة واحدة أمر مرهق حتى للخوارزميات المتقدمة، ويعرضها لخطر التقاط ضوضاء بلا معنى. لذلك استخدم الباحثون «منخلًا» مكوّنًا من خطوتين لعزل مجموعة أصغر من الجينات المفيدة حقًا. أولاً، طبقوا تقنية تُدعى الغابة العشوائية (Random Forest)، والتي تستطلع من خلال العديد من أشجار القرار أي الجينات هي الأهم لتمييز الأنسجة السرطانية عن السليمة. قلّصت هذه الخطوة القائمة إلى 436 جينًا واعدًا. بعد ذلك، درسوا كيف تتصرف هذه الجينات معًا باستخدام تنقيب قواعد الترابط، وهي طريقة تكشف مجموعات الجينات التي تميل إلى أن تكون نشطة في نفس الوقت في الأورام. حددت هذه الطبقة الإضافية من التحليل أزواجًا وشبكات جينية مرتبطة بعمليات سرطانية رئيسية مثل الانقسام الخلوي السريع، وإصلاح تلف الحمض النووي، وتغيرات في النسيج المحيط بالورم. بعد هذا التصفيق، تبقى 332 جينًا — لا تزال غنية بالمعنى البيولوجي لكنها أكثر قابلية للإدارة للتحليل الأعمق.
شبكة عصبية ذات جزئين تتعلم الأنماط والسياق
مع مجموعة الجينات المركزة هذه، بنى الفريق نموذج تعلم عميق هجين يجمع بين نوعين من الشبكات العصبية. جزء واحد، المعروف بالشبكة الالتفافية، يمسح طول قائمة الجينات لالتقاط الأنماط المحلية — تجمعات من الجينات التي تميل إلى الارتفاع أو الانخفاض معًا. أما الجزء الثاني، شبكة ذاكرة ثنائية الاتجاه، فينظر إلى نفس المعلومات مع متابعة العلاقات طويلة المدى، لالتقاط كيفية تأثير جينات بعيدة على بعضها طوال الملف الجيني. قبل التدريب،وازن المؤلفون البيانات بحيث تمثل عينات السرطان وغير السرطان بإنصاف وأضافوا كميات صغيرة من الضوضاء الاصطناعية، لتعليم النموذج عدم الانخداع بتقلبات عشوائية.
كيف يؤدّي النظام في الاختبارات الواقعية
عند تدريبه واختباره على بيانات TCGA، ميزت الشبكة الهجينة بين العينات الورمية والطبيعية بدقة تقارب 97% وبقدرة تكاد تكون كاملة على فصل المجموعتين. والأهم من ذلك أنها تفوقت على إعدادات التعلم العميق الأبسط وأدوات التعلم الآلي القياسية مثل الانحدار اللوجستي وآلات الدعم الناقلة، حتى عندما تلقت تلك الطرق المتنافسة نفس الجينات المختارة بعناية. الاختبار الأقوى، مع ذلك، كان ما إذا كان النموذج سيصمد على مجموعة بيانات مختلفة تمامًا. عند تطبيقه على METABRIC، التي جُمعت في مستشفيات أخرى باستخدام طرق مخبرية مختلفة، حافظ النظام على أداء مرتفع: في أفضل تشغيل له حقق دقة بلغت 99.3% وتعرف بشكل صحيح على كل مريض توفي لاحقًا بسبب سرطان الثدي، وهي خاصية حاسمة إذا كان من المقرر استخدام الأداة لوضع علامات على الحالات عالية المخاطر.

ماذا قد يعني هذا للرعاية المستقبلية
لغير المتخصص، الخلاصة أن هذه الدراسة تقدم مرشحًا وقارئًا ذكيًا للبيانات الجينية يمكنه رصد سرطان الثدي والمخاطر المرتبطة به باتساق ملحوظ عبر مجموعات كبيرة من المرضى. من خلال الجمع بين استراتيجية انتقاء جينات مدروسة وشبكة عصبية ذات فرعين، يظهر المؤلفون أن الحواسيب قادرة على استخلاص إشارات ذات معنى سريري من مجموعات بيانات جينية هائلة، ليس فقط في دراسة واحدة بل عبر مجموعات مستقلة. بينما يلزم مزيد من العمل لاختبار النهج في جماعات متنوعة ولشرح قراراته بالتفصيل، يشير الأسلوب إلى مستقبل قد تغذي فيه عينة دم أو نسيج بسيطة مثل هذه النماذج لمساعدة الأطباء على اكتشاف الأورام مبكرًا وتخصيص العلاج بدقة أكبر.
الاستشهاد: Hesham, F., Abbassy, M.M. & Abdalla, M. Hybrid tuned deep learning model for breast cancer diagnosis using genetic data. Sci Rep 16, 9664 (2026). https://doi.org/10.1038/s41598-026-41643-8
الكلمات المفتاحية: علم الجينوم لسرطان الثدي, تشخيص بالتعلّم العميق, مؤشرات حيوية لتعبير الجينات, الكشف المبكر عن السرطان, دعم اتخاذ القرار السريري