Clear Sky Science · ar
نموذج مختلط لاختيار الميزات والتصنيف باستخدام بيانات عالية الأبعاد قائم على خوارزمية ميتاهيريستية لتشخيص سرطان الدماغ
لماذا تهم اختبارات أذكى لأورام الدماغ
تعد أورام الدماغ من بين أكثر أنواع السرطان فتكا، ومع ذلك لا يزال الأطباء يواجهون صعوبة في التمييز بسرعة ودقة بين الأنواع المختلفة من الأورام. يمكن أن تكون الاختبارات المخبرية التقليدية بطيئة، وتولّد الاختبارات الحديثة المعتمدة على الجينات كمّا هائلا من البيانات: عشرات الآلاف من قياسات الجينات لكل مريض. تقدم هذه الدراسة طريقة حاسوبية تنخل هذا الضجيج الوراثي لتجد مجموعة صغيرة من الجينات الرئيسية التي تساعد على فصل الأورام الخطيرة عن الحالات الأقل عدوانية، بهدف دعم تشخيص أكثر دقة وفي النهاية اتخاذ قرارات علاجية أفضل.

تحويل بحر الجينات إلى دلائل مفيدة
عمل الباحثون مع مجموعة بيانات عامة لسرطان الدماغ تحتوي على 130 عينة مرضية، تم قياس كل منها لأكثر من 54,000 جين. مثل هذه البيانات عالية الأبعاد قوية لكنها معقدة: هناك قياسات جينية أكثر بكثير من عدد المرضى، والعديد من الجينات غير ذات صلة أو مكررة. إذا أُدخلت مباشرة في خوارزمية تعلم، يمكن لهذا الاختلال أن يؤدي إلى أنماط مضللة وأداء ضعيف على مرضى جدد. التحدي المركزي هو الاحتفاظ فقط بالجينات الأكثر إبلاغا مع التخلص من الباقي، من دون فقدان إشارات بيولوجية مهمة.
نهج من خطوتين للعثور على أكثر الجينات دلالة
لمعالجة ذلك، صمم الفريق خط أنابيب مختلط لاختيار الميزات. في الخطوة الأولى، يقوم مرشح إحصائي سريع يسمى «الحدّ الأدنى من التكرار، الحدّ الأقصى من الصلة» (mRMR) بمسح جميع الجينات والاحتفاظ بتلك المرتبطة ارتباطًا قويًا بسرطان الدماغ مع أن تكون مختلفة قدر الإمكان عن بعضها البعض. هذا يقلّص بسرعة قائمة الجينات من عشرات الآلاف إلى مجموعة أكثر قابلية للإدارة. في الخطوة الثانية، يستخدم أسلوب بحث مستوحى من سلوك الصيد لدى طيور الجوارح—تحسين صقور هاريس (Harris Hawks Optimization)—يتعامل مع كل مجموعة جينية ممكنة كحل مرشح ويجري عملية «مطاردة» تكرارية للعثور على التركيبات التي تعطي أفضل نتائج تصنيف. معًا تقلل هاتان المرحلتان الجينات الأصلية البالغ عددها 54,676 إلى 50 جينًا فقط لا تزال تلتقط جوهر المرض.
تدريب الآلات لرسم فاصل تشخيصي أوضح
بعد تحديد مجموعة جينية مدمجة، درّب المؤلفون عدة نماذج للتعلم الآلي لتمييز خمس فئات من سرطان الدماغ، وبشكل أوسع بين الأنسجة الخبيثة والأقل خطورة. نموذج رئيسي، آلة دعم المتجهات، يحتاج إلى ضبط زوج من معلمات الحساسية التي تؤثر بشدة على سلوكه. بدلًا من ضبطها عن طريق التجربة والخطأ، استخدم الفريق ثلاث استراتيجيات تحسين—تحسين سرب الجسيمات، التطور التفاضلي، وتحسين صقور هاريس—للبحث المنهجي عن أفضل الإعدادات. قيّموا الأداء باستخدام التحقق المتقاطع المتكرر الصارم وفحوص إضافية مثل إعادة أخذ العينات بالمعاينة العشوائية (bootstrap) وتحليل منحنيات التعلم لضمان أن النماذج لم تكن تحفظ ببساطة مجموعة البيانات الصغيرة.

مدى فعالية النظام وماذا تعني الجينات
بفضل اختيار الجينات المختلط والتحسين، حققت آلة دعم المتجهات دقة تقارب 96% على بيانات سرطان الدماغ، متفوقة بوضوح على الطرق التقليدية مثل أشجار القرار. كما خفضت الطريقة عدد الجينات من أكثر من 54,000 إلى 50 مع الحفاظ على القدرة التنبؤية وحتى تحسينها. العديد من الجينات المختارة معروفة بالفعل بتورطها في نمو الخلايا وإصلاح الحمض النووي وتكوّن الأوعية الدموية أو الاستجابة المناعية في أورام الدماغ، ما يمنح مصداقية بيولوجية لخيارات الحاسوب. هذا يعني أن النموذج ليس جيدًا فقط في التصنيف بل يشير أيضًا للباحثين إلى مؤشرات حيوية محتملة تستحق الدراسة المختبرية.
ما الذي قد يعنيه ذلك للمرضى
بعبارات بسيطة، تُظهر الدراسة أنه من الممكن ضغط حجم هائل من البيانات الجينية إلى «توقيع جيني» صغير وذي مغزى يساعد في فصل أنواع أورام الدماغ المختلفة باعتمادية عالية. وبينما ما تزال الدراسة مبنية على مجموعة مرضى نسبيا صغيرة وتحتاج اختبارًا على مجموعات أكبر وأكثر تنوعًا، فإنها تشير إلى مسار نحو أدوات تشخيص جينية أسرع ودقيقة وقابلة للتفسير. إذا تمت المصادقة عليها ودمجها في سير العمل السريري، قد تزود هذه الأدوات الأطباء بأدلة أقوى عند اختيار العلاجات وتساعد العلماء على التركيز على قائمة قصيرة من الجينات الأكثر احتمالًا في التأثير على كيفية بدء أورام الدماغ ونموها واستجابتها للعلاج.
الاستشهاد: Manhrawy, I.I.M., Fathi, H., Alsekait, D.M. et al. Hybrid feature selection and classification model using high-dimensional data based on a metaheuristic algorithm for brain cancer diagnosis. Sci Rep 16, 11909 (2026). https://doi.org/10.1038/s41598-026-41573-5
الكلمات المفتاحية: تشخيص سرطان الدماغ, تعبرير الجينات, اختيار الميزات, التعلّم الآلي, المؤشرات الحيوية