Clear Sky Science · ar
تحسين التنبؤ بالسكري باستخدام شبكات CNN مدربة مسبقًا وLSTM وGAN شرطي على بيانات رقمية محولة
لماذا أهمية فحوصات السكري الأكثر ذكاءً
عادةً ما يُطلق على السكري من النوع الثاني اسم «المرض الصامت» لأنه يمكن أن يتلف القلب والكليتين والعينين والأعصاب بهدوء قبل أن تظهر الأعراض بوضوح. يجمع الأطباء بالفعل قياسات بسيطة—مثل مستوى السكر في الدم وضغط الدم والوزن والعمر—لتقييم خطر الإصابة لدى الشخص. لكن تحويل هذه الأرقام القليلة إلى نظام إنذار مبكر دقيق أمر أصعب مما يبدو، خاصة عندما تكون البيانات المتاحة محدودة. تستكشف هذه الدراسة طريقة مبتكرة لاستخراج مزيد من المعلومات من مجموعات بيانات روتينية صغيرة حتى تتمكن الحواسيب من اكتشاف من هم الأكثر احتمالًا لتطوير السكري، مما قد يسمح بتقديم رعاية أبكر وتقليل المضاعفات.
تحويل الأرقام إلى صور
تُخزن معظم السجلات الطبية على شكل صفوف أرقام في جدول. تعمل أنظمة التعلم العميق الحديثة المعتمدة على الصور بشكل أفضل مع الصور الفعلية. يجسر الباحثون هذه الفجوة بتحويل كل ثمانية قياسات روتينية لكل شخص من مجموعة بيانات سكري معروفة إلى صورة اصطناعية صغيرة. تُوضع الميزات التي تميل إلى التغير معًا—مثل مستوى السكر ومؤشر كتلة الجسم—قريبة من بعضها في الصورة، وتُعطى الميزات الأكثر أهمية مساحات أكبر. في الواقع، يصبح ملف المريض الصحي بمثابة صورة بسيطة منقوشة يمكن لشبكات التعرف على الصور قراءتها. يتيح هذا النوع من تحويل «الجداول إلى صور» للفريق إعادة استخدام أدوات قوية طورت أصلاً لمهام مثل التعرف على الأشياء والتصوير الطبي.

تعليم الآلات من بيانات قليلة جدًا
عقبة رئيسية في التنبؤ بالسكري هي أن مجموعات البيانات العامة متواضعة الحجم وغالبًا ما تكون غير متوازنة، مع عدد أقل من الأشخاص في مجموعة المصابين مقارنة بغير المصابين. قد يؤدي تدريب شبكات عصبية كبيرة على عينات صغيرة ومنحازة إلى نماذج تقدم أداءً جيدًا على الورق لكنها تفشل مع مرضى جدد. لمواجهة ذلك، أعاد المؤلفون أولاً موازنة البيانات بحيث يمثَّل كل من النتيجتين بالتساوي. ثم استخدموا نوعًا من النماذج التوليدية، هو GAN شرطي، لإنشاء العديد من الصور التركيبية الإضافية التي تشبه المرضى الحقيقيين من كل مجموعة. توسع هذه الأمثلة الصناعية مجموعة التدريب من 1000 إلى 9000 صورة مع الحفاظ على البنية الإحصائية العامة، مما يمنح خوارزميات التعلم تنوعًا أكبر للتدرّب عليه.
شبكات متعددة الطبقات تقرأ الأنماط والسياق
بعد تحويل السجلات الرقمية إلى صور وتوسيعها بأمثلة تركيبية، تُمرَّر الصور عبر عدة شبكات متقدمة للتعرف على الصور كانت قد تدربت مسبقًا على مجموعات صور عامة كبيرة. تعمل هذه النماذج المدربة مسبقًا—مثل DenseNet وResNet وXception وEfficientNet—ككاشفات ميزات ذات خبرة عالية، حيث تستخرج مئات الأنماط البصرية الدقيقة من كل صورة. بدلاً من اتخاذ قرار مباشرة، تُعامل مخرجاتها كسلاسل مرتبة وتُغذى إلى نوع ثانٍ من الشبكات يُسمى LSTM، وهو جيد في اكتشاف الاعتمادات داخل السلاسل. من خلال تكديس هذين المرحلتين، يمكن للنظام التقاط كل من الأنماط المحلية (كيف تتجمع القياسات المرتبطة) والعلاقات الأوسع (كيف تشير مجموعات القياسات معًا إلى الخطر) قبل أن يقرر ما إذا كان الشخص من المحتمل أن يكون مصابًا بالسكري.

ما مدى فعالية النظام؟
عند تقييمه على النسخة الموسعة من مجموعة بيانات «بيما إندينز» الكلاسيكية للسكري، صَنَّف التكوين الأكثر أداءً—مستخرج ميزات قائم على ResNet مدمج مع LSTM ودمج ميزات من جميع نماذج الصور الأربعة—حوالي 94% من الحالات بشكل صحيح وحقق قيمة المساحة تحت المنحنى (AUC) بنسبة 98%، وهو مقياس شائع لمدى قدرة الاختبار على تمييز مجموعتين. هذه الأرقام أعلى من العديد من النتائج المبلغ عنها سابقًا والتي اعتمدت على أساليب تعلم آلي تقليدية تعمل مباشرة على جدول الأرقام الخام. للتحقق مما إذا كانت المقاربة قد تتعمم خارج مجموعة سكانية دراسية واحدة، اختبر المؤلفون أيضًا النظام على مجموعة بيانات مستقلة من مستشفى ألماني. هناك، بلغ النظام دقة وتمييزًا مماثلين، رغم الاختلافات في العمر والجنس والخلفية بين مجموعتي المرضى.
الوعود والتحفظات للاستخدام في العالم الحقيقي
للغير مختصين، الخلاصة الرئيسية هي أن القياسات السريرية المألوفة والمنخفضة التكلفة يمكن أن تصبح أكثر إفادة بإعادة تصورها كصور بسيطة وترك أدوات تحليل الصور الناضجة تقوم بالعمل الشاق. تشير الدراسة إلى أن هذه الاستراتيجية، مقترنة ببيانات تركيبية واقعية وشبكات عصبية متعددة الطبقات، يمكن أن تُحسّن فحص الحاسوب للسكري وربما أمراض أخرى تعتمد على سجلات منظمة. في الوقت نفسه، يؤكد المؤلفون على تحفّظات مهمة: قد يكون جزء من الأداء القوي ناتجًا عن البيانات التركيبية، وكلا المجموعتين محدودة في الحجم والتنوع الديموغرافي. قبل أن يوجّه مثل هذا النظام الرعاية السريرية، يجب اختباره على مجموعات مرضى أكبر وأكثر تنوعًا وإقرانه بتفسيرات يمكن للأطباء الوثوق بها. مع ذلك، يشير العمل إلى مستقبل قد تُمكن فيه حتى مجموعات البيانات الروتينية الصغيرة من توفير إنذارات مبكرة أكثر موثوقية للأمراض المزمنة.
الاستشهاد: Singh, K.R., Dash, S., Liu, H. et al. Enhanced diabetes prediction using pre-trained CNNs, LSTM, and conditional GAN on transformed numerical data. Sci Rep 16, 8081 (2026). https://doi.org/10.1038/s41598-026-38942-5
الكلمات المفتاحية: السكري من النوع الثاني, الذكاء الاصطناعي الطبي, التعلّم العميق, تنبؤ المخاطر, البيانات التركيبية