Clear Sky Science · ar
طريقة للتنبؤ بأمراض القلب والأوعية الدموية تعتمد على استراتيجية التركيب المتبادل وتجميع مكدس مرن بالأوزان الديناميكية
لماذا يهم التنبؤ بمخاطر القلب
تظل أمراض القلب والأوعية الدموية السبب الرئيسي للوفاة على مستوى العالم، وغالبًا ما تظهر دون إنذار واضح. يعرف الأطباء العديد من عوامل الخطر — مثل التدخين وارتفاع الكوليستيرول وارتفاع السكر في الدم — لكن جمع هذه الأدلة معًا لكل فرد يشكل تحديًا، لا سيما عندما تكون البيانات فوضوية أو واردة من مستشفيات ومجموعات سكانية مختلفة. تعرض هذه الدراسة طريقة حاسوبية جديدة تجمع بين عدة نماذج تنبؤية وتتعلّم تلقائيًا مدى الثقة بكلٍ منها، بهدف رصد مخاطر أمراض القلب والأوعية الدموية بدقة أكبر وفي مراحل أبكر من الأدوات الحالية.

ما بعد درجات المخاطر البسيطة
تفترض حاسبات المخاطر التقليدية، مثل الدرجات السريرية الشهيرة، علاقات بسيطة وخطية نسبيًا بين القياسات والمرض. لكن الواقع أن الجسم يتصرف على نحو أكثر تعقيدًا، حيث تتداخل عوامل مثل الكوليستيرول وضغط الدم والجلوكوز بطرق غير خطية. يمكن لأساليب التعلم الآلي الحديثة أن تكشف هذه الأنماط، لكن النماذج المفردة غالبًا ما تعمل كـ"صناديق سوداء" وقد تفشل عند تطبيقها على مجموعات مرضى جديدة. أما طرق النماذج المجمعة الحالية فتعتمد كثيرًا على أوزان ثابتة تُحدد مرة واحدة ولا تتغير، مما يجعلها بطيئة في التكيف عندما تتبدل تركيبة المرضى أو جودة البيانات بمرور الوقت.
مزج وجهات نظر متعددة لنفس المريض
يتصدى المؤلفون لهذه القيود باستراتيجية يسمونها التركيب المتبادل. بدلاً من الاعتماد على طريقة واحدة لاختيار عوامل الخطر المهمة، يطبقون ثمانية أساليب مختلفة لاختيار الميزات على نفس مجموعات البيانات. تتضمن هذه الأساليب مرشحات إحصائية بسيطة، وإجراءات تختبر مرارًا أي المتغيرات أكثر أهمية، وتقنيات مرتبطة ارتباطًا وثيقًا بخوارزميات تعلم محددة. ثم يتم إقران كل مجموعة ميزات مختارة مع واحد من 14 مصنفًا متنوعًا، يتراوح من نماذج قائمة على الاحتمالات البسيطة إلى أشجار القرار والشبكات العصبية. في المجموع، تُنشأ 112 نموذجًا تنبؤيًا مرشحًا، كلٌ منها يقدم "وجهة نظر" مختلفة قليلًا للعلاقات بين خصائص المريض ومرض القلب.
ترك الأوزان تتطور مع الزمن
من هذه المجموعة الكبيرة، يُختار أفضل عشرة نماذج لتكوين تجميع ensemble. وهنا تكمن الابتكار في إطار عمل مكدس بأوزان ديناميكية. في البداية يُعطى كل نموذج أساسي تأثير متساوٍ. أثناء التدريب، يختبر النظام مرارًا مدى أداء كل نموذج على طيات مختلفة من البيانات ويضبط وزنه استجابة للأخطاء — النماذج التي تحقق أداءً أفضل تكتسب تأثيرًا أكبر، في حين تُقلل مساهمة النماذج الأضعف تدريجيًا. تُدمَج مخرجات هذه النماذج المضبوطة لتشكيل مجموعة إشارات جديدة تغذي صانع قرار نهائي قائم على طريقة الجيران الأقرب k، التي تتفوق في التعرف على الأنماط المحلية دون افتراض شكل بيانات محدد. تتيح هذه العملية التكيفية للتجميع التكيف مع التحولات في توزيع البيانات، مثل إدخال مستشفى جديد أو تغير تركيبة المرضى.

الاختبار على مجموعات بيانات قلبية حقيقية
قُيِّمت الطريقة على ثلاث مجموعات بيانات معروفة لأمراض القلب: مجموعة مستشفى صغيرة ومتوازنة من كليفلاند، ودراسة مجتمعية أكبر وغير متوازنة بشدة من فريمينغهام، ومجموعة كبيرة جدًا تضم 70,000 سجل مع معلومات رقمية وفئوية. عمل الباحثون على تنظيف البيانات بدقة، وملء القيم المفقودة حيثما كان مناسبًا، والتعامل مع القيم الشاذة. عبر المجموعات الثلاث، حقق نموذجهم المجمَّع دقة أعلى وتمييزًا أفضل بين المرضى والغير مرضى مقارنة بأي من النماذج الفردية والعديد من الطرق المتقدمة الحديثة. على سبيل المثال، في بيانات كليفلاند وصل إلى نحو 98 بالمئة دقة مع قدرة تقارب الكمال في فصل المصابين عن غير المصابين، كما حسّن الأداء على مجموعات البيانات غير المتوازنة والواسعة النطاق.
فتح صندوق التنبؤات الأسود
لجعل النظام أكثر قبولًا في الممارسة السريرية، استخدم الفريق SHAP، وهي تقنية تفسير حديثة، لقياس مدى مساهمة كل عامل إدخالي في التنبؤ. بدلًا من الاكتفاء بالإبلاغ أن المريض معرض لمخاطر عالية، يمكن للنموذج الإشارة إلى أن سلوك التدخين أو مستويات الدهون أو سكر الدم كانت من الدوافع الرئيسية لذلك الاستنتاج. ومن المثير أن الميزات الأكثر تأثيرًا التي حدّدها النموذج تتوافق مع إرشادات الوقاية الحالية في الصين، التي تبرز التدخين والدهون الدموية غير الطبيعية والسكري كعوامل قابلة للتعديل رئيسية لأمراض القلب والأوعية الدموية. لا تزال عوامل مثل العمر وضغط الدم مهمة، لكنها ضمن هذه المجموعات ساهمت بدرجة أقل إلى حد ما في القرار النهائي مقارنة بعلامات نمط الحياة والاضطرابات الأيضية.
ما الذي يعنيه هذا لصحة الناس اليومية
الخلاصة لغير المتخصصين هي أن نماذج حاسوبية أكثر ذكاءً ومرونة يمكن أن تحسّن قدرة الأطباء على توقع مشكلات القلب قبل أن تتسبب في ضرر لا يمكن عكسه. من خلال دمج العديد من النماذج الصغيرة وإعادة موازنة تأثيرها باستمرار، تتعامل الطريقة المقترحة بشكل أفضل مع البيانات الطبية الصاخبة وغير المتوازنة والمتغيرة. وفي الوقت نفسه، يساعد استخدام أدوات التفسير في الحفاظ على التركيز على عوامل الخطر المألوفة — لا سيما التدخين والكوليستيرول وسكر الدم — التي يمكن للمرضى والأطباء فعلًا تعديلها. رغم أن الاختبارات الإضافية في بيئات سريرية حقيقية وعلى أنواع أغنى من البيانات لا تزال مطلوبة، تشير هذه العمل إلى أن نظم التنبؤ المستقبلية قد تصبح أدق وأكثر شفافية في توجيه الوقاية من أمراض القلب والأوعية الدموية.
الاستشهاد: Qi, X., Gao, J., Qi, H. et al. A cardiovascular disease prediction method based on cross-combination strategy and dynamic weighted stacking ensemble. Sci Rep 16, 13901 (2026). https://doi.org/10.1038/s41598-026-48006-3
الكلمات المفتاحية: التنبؤ بأمراض القلب والأوعية الدموية, تعلم التجميع, التعلم الآلي في الطب, عوامل الخطر, قابلية تفسير النموذج