Clear Sky Science · ar

نموذج قائم على التجميع والانحدار وتحليل الأداء للتنبؤ المبكر بأمراض القلب

· العودة إلى الفهرس

لماذا يهم اكتشاف مشاكل القلب مبكراً

غالباً ما تتطور أمراض القلب بصمت على مدى سنوات عديدة، وبحلول الوقت الذي تظهر فيه أعراض واضحة قد يكون الضرر قد وقع بالفعل. تستكشف هذه الدراسة كيف يمكن لأجهزة الاستشعار المرتدية اليومية والتحليل الذكي للبيانات أن يعملا معاً لرصد علامات التحذير في وقت أبكر، مما يمنح الأطباء والمرضى مزيداً من الوقت للتدخل. من خلال الجمع بين طريقتين مختلفتين لتحليل بيانات الصحة، يهدف الباحثون إلى جعل التنبؤات أكثر دقة دون تعقيد التكنولوجيا بحيث يصعب استخدامها في العيادات الحقيقية.

Figure 1
Figure 1.

من أجهزة الاستشعار الجسدية إلى تحذيرات ذكية

تجري الدراسة في سياق شبكات المنطقة الجسدية اللاسلكية، حيث تراقب أجهزة استشعار صغيرة موضوعة على الجلد إشارات مثل معدل نبضات القلب، وضغط الدم، والنشاط الكهربائي للقلب. ترسل هذه الأجهزة القياسات إلى جهاز محمول، الذي يمررها إلى مركز طبي للمعالجة والتحليل. الفكرة الأساسية هي أن هذه التدفقات الرقمية يمكن أن تكشف عن أنماط تشير إلى مشاكل قلبية قابلة للتطور قبل حدوث أزمة بوقت طويل. يركز المؤلفون على مجموعة بيانات معروفة لأمراض القلب، مختارين 12 متغيراً مهماً منها نوع ألم الصدر، وضغط الدم، والكوليسترول، وسكر الدم، وضيق الصدر المستحث بالتمارين، والتغيرات المرصودة في تخطيط القلب الكهربائي.

اكتشاف مجموعات خفية في بيانات المرضى

بدلاً من إدخال جميع سجلات المرضى مباشرة في صيغة تنبؤ واحدة، يقوم الفريق أولاً بتجميع المرضى المشابهين معاً. يستخدمون طريقة تسمى K-means للتجميع، التي تصنف الأشخاص إلى مجموعات اعتماداً على تشابه قياساتهم، مع لعب العمر دوراً محورياً. على سبيل المثال، يمكن أن تقع الحالات طبيعياً في مجموعات ذات ضغط دم مرتفع جداً، أو كوليسترول مرتفع، أو أنماط معينة في اختبارات القلب. تساعد خطوة التجميع هذه في إبراز أي تراكيب من القياسات تكون مقلقة بشكل خاص. كما تكشف أن نطاقات معينة—مثل ضغط الدم فوق 150، أو الكوليسترول فوق 300، أو تغيرات محددة في تخطيط القلب—ترتبط عادةً بمخاطر أعلى بكثير.

تعليم الآلات لتقييم الخطر

بعد تجميع البيانات، يطبق الباحثون عدة طرق تعلم آلي تتعلم من الحالات السابقة لتتنبأ بما إذا كان المريض الجديد من المحتمل أن يعاني من مرض قلبي ذو أهمية. يقارنون بين نهج مختلفة، بما في ذلك أشجار القرار، وجار أقرب k، وآلات الدعم الناقلة، والانحدار اللوجستي، ونايف بايز، والغابات العشوائية. في التصميم الهجين لديهم، يتم أولاً إسناد كل مريض جديد إلى أقرب مجموعة؛ ثم يقوم نموذج الغابة العشوائية المدرب خصيصاً على نوع هذا المريض بإصدار التنبؤ النهائي للمخاطر. تُنظف البيانات بعناية، وتُقاس وتتدرج، وتُقسم إلى مجموعات تدريب واختبار، ويتم معالجة عدم توازن الفئات (وجود عدد أكبر من الأصحاء مقارنة بالمرضى) حتى لا تنحاز النماذج لمجموعة الأغلبية.

Figure 2
Figure 2.

مدى أداء النموذج الهجين

لتقييم النجاح، تنظر الدراسة ليس فقط إلى الدقة الإجمالية ولكن أيضاً إلى مدى قدرة النموذج على تمييز المرضى المرضى بشكل صحيح (الاستدعاء)، وطمأنة الأصحاء بشكل صحيح (الخصوصية)، وموازنة الهدفين معاً (مقياس F1 ومنحنى ROC–AUC). غالباً ما بلغت دراسات سابقة تستخدم بيانات مشابهة حدها الأقصى عند حوالي 85 بالمئة دقة وكانت تكافح لتحسين هذه المقاييس التفصيلية. هنا، يصل نهج التجميع مع الغابة العشوائية إلى حوالي 91 بالمئة دقة، مع استدعاء قوي وخصوصية عالية جداً. نطاقات الثقة لهذا النموذج لا تتداخل مع نطاقات الطرق الأبسط، ما يشير إلى أن التحسن من غير المرجح أن يكون ناتجاً عن الصدف. في الوقت نفسه، يظل وقت الحوسبة في نطاق عملي—بمقدار ميلي ثانية إلى ثوان—مما يجعله مناسباً لأنظمة المراقبة الفورية أو القريبة من الفورية.

ما الذي يعنيه هذا للمرضى والأطباء

بكلام مبسط، تُظهر الدراسة أن السماح للحواسب أولاً بفرز المرضى إلى مجموعات ذات معنى ثم تطبيق قواعد تنبؤ مصممة خصيصاً يمكن أن يحسّن الكشف المبكر عن أمراض القلب. تبدو الطريقة واعدة خاصة في إعدادات المراقبة المستمرة، حيث تجمع أجهزة الاستشعار القابلة للارتداء البيانات بهدوء في الخلفية. وبينما تأتي النتائج من مجموعة بيانات منظمة ومحدودة الحجم بدلاً من سجلات سريرية كاملة، ويحذر المؤلفون من تحيزات محتملة، فالرسالة واضحة: الاستخدام الأذكى للقياسات المتاحة يمكن أن يمنح الأطباء نظام إنذار مبكر أكثر موثوقية. مع مزيد من العمل ومجموعات بيانات أكبر وأكثر ثراء، يمكن لهذا النوع من التحليل الهجين أن يساعد في تحويل قراءات أجهزة الاستشعار الخام إلى تنبيهات شخصية وفي الوقت المناسب تمنع النوبات القلبية وحوادث خطيرة أخرى قبل حدوثها.

الاستشهاد: Tolani, M., AlZahrani, Y., Suman, G. et al. Clustering-cum-regression based model and performance analysis for early prediction of heart disease. Sci Rep 16, 9494 (2026). https://doi.org/10.1038/s41598-026-40626-z

الكلمات المفتاحية: التنبؤ بأمراض القلب, أجهزة استشعار صحية قابلة للارتداء, تعلم الآلة, تجميع البيانات الطبية, نموذج الغابة العشوائية