Clear Sky Science · ar

عدم الاستقرار وحدود الأداء لشبكات العصبونات التلافيفية على البيانات الطبية الجدولية غير المتسلسلة: تحقيق تجريبي

2026-03-03 · العودة إلى الفهرس

لماذا يهم هذا في الممارسة الطبية اليومية

تعتمد المستشفيات بشكل متزايد على الذكاء الاصطناعي للمساعدة في التنبؤ بمن لديهم سرطان أو أمراض قلبية أو عدوى خطيرة باستخدام سجلات طبية تشبه الجداول بدلاً من الصور. تطرح هذه الدراسة سؤالاً يبدو بسيطاً لكنه ذو عواقب عملية كبيرة: هل شبكات العصبونات الشائعة المصممة للصور موثوقة فعلاً عندما نزوّدها ببيانات طبية غير مصورة مرتبة في أعمدة، أم أنها تتصرف بشكل غير متوقع بطريقة قد تضلل الأطباء والمرضى؟

نوعان من الحاسبات المستوحاة من الدماغ

قارن الباحثون عائلتين من الشبكات العصبية التي تحاكي، بصورة تقريبية، كيفية معالجة الدماغ للمعلومات. الشبكات العصبية التلافيفية (CNNs) هي العمود الفقري للتعرف على الصور الحديثة؛ فهي تمسح الصور على قطع صغيرة تبحث عن أنماط محلية مثل الحواف أو القوام ثم تبني أشكالاً أكثر تعقيداً. أما الشبكات متعددة الطبقات (MLPs) فاتبعت نهجاً أبسط: تتعامل مع كل خاصية إدخال — مثل العمر أو ضغط الدم أو نتيجة مختبر — كقيمة مستقلة وتتعلم توليفات موزونة من جميعها دفعة واحدة، من دون افتراض ترتيب أو جارٍة خاصة.

اختبار الجداول الطبية

لمعرفة كيف تتصرف هذه النماذج على بيانات صحية واقعية، استخدم الفريق ثلاث مجموعات بيانات طبية معروفة تشبه الجداول أكثر من كونها صوراً. احتوت إحداها على ميزات مختبرية وسريرية لمرضى COVID‑19 للتنبؤ بمن سينجو. وصفت أخرى قياسات مجهرية لأورام الثدي لتمييز الحالات الخبيثة عن الحميدة. والتالية جمعت عوامل خطر أمراض القلب الكلاسيكية من قاعدة بيانات طب القلب. ومن المهم أن هذه المجموعات تضع المتغيرات جنباً إلى جنب دون وجود ترتيب "من اليسار إلى اليمين" يحمل معنى، على خلاف بكسلات الصورة.

خلط الأعمدة وهز النماذج

جوهر الدراسة كان اختبار إجهاد هائل. أعاد المؤلفون خلط ترتيب أعمدة الإدخال مراراً وبنفس الوقت غيّروا عشوائياً عناصر تصميم رئيسية في CNN، مثل عدد "قوارئ الرقع" الصغيرة (المرشحات)، وعرض تلك الرقع، وعدد العصبونات في طبقة اتخاذ القرار النهائية. ولكل تركيبة ترتيب‑بنية—بما مجموعه 1000 تبديل—درّبوا CNN وبالتوازي MLP مماثلاً. بدلاً من التركيز على دقة وحيدة "أفضل"، نظروا إلى كيفية انتشار درجات الأداء عبر كل هذه التجارب، مستخدمين المساحة تحت منحنى ROC (AUROC) كمُلخّص لمدى قدرة كل نموذج على فصل المرضى المرضى عن الأصحاء.

ما وجده داخل الصندوق الأسود

أظهرت النتائج صورة مقلقة بالنسبة لـCNNs على الجداول الطبية غير المصورة. في بعض الإعدادات المختارة بعناية، استطاعت CNNs مضاهاة أو حتى التفوق قليلاً على MLPs في أعلى أداء — لا سيما في بيانات سرطان الثدي التي احتوت على ميزات قوية ومفصّلة. لكن عبر كل الخلطات والهندسات، أظهرت CNNs تقلبات أوسع بكثير في الأداء، مع ميل مقلق لانهيارات عرضية شديدة. كان نجاحها أو فشلها يعتمد بشدة على اختيارات اعتباطية: كيفية ترتيب الأعمدة، وحجم نافذة المسح، وعدد المرشحات والعصبونات في الطبقة النهائية. النوافذ الأكبر، التي تخلط بين ميزات مجاورة كثيرة، أضرت باستمرار بمتوسط الأداء وبالاستقرار على هذه المدخلات غير المتسلسلة.

لماذا كانت النماذج الأبسط غالباً أفضل

على النقيض من ذلك، كانت MLPs أقل حساسية لترتيب الأعمدة بكثير. ولأنها لا تعتمد على الجوار المحلي، فإن خلط الميزات لم يغير ما يمكن للنموذج تعلمه مبدئياً. عندما زاد الباحثون عدد العصبونات في الطبقة المخفية للـMLP، تحسّن أداؤه تدريجياً وغالباً ما بلغ مستويات متفوقة على CNNs، رغم استخدامه لعدد أقل من المعاملات الكلية. أدت المجموعات التي تحتوي على ميزات واضحة ومفيدة إلى درجات مرتفعة ومستقرة لكلا النموذجين، لكن CNNs بقيت تحمل مخاطر انهيار عرضي أكبر. في مجموعات أصعب تهيمن عليها إشارات أضعف، تفاوت أداء CNN بشكل كبير مع تغيّر البنية، بينما بقيت MLPs أكثر ثباتاً نسبياً.

الرسالة العملية للذكاء الاصطناعي السريري

بالنسبة للتطبيقات الطبية التي تعتمد على سجلات تشبه الجداول بدلاً من الصور، تختتم هذه الدراسة أن CNNs قد تكون أدوات هشة. القوة الظاهرة لها في بعض المقاييس قد تعكس ترتيباً محظوظاً للأعمدة وقرارات تصميمية بعينها بدلاً من تعلم قوي ومتبادل للأنماط الطبية. قدمت MLPs وطرق أخرى لا تفترض تخطيطاً مكانياً ذا معنى سلوكاً أكثر موثوقية عبر آلاف التجارب. بالنسبة للأطباء، وعلماء بيانات المستشفيات، والمنظمين، فالدرس واضح: عند بناء أنظمة ذكاء اصطناعي على بيانات صحية جدولية، من الأكثر أماناً إعطاء الأولوية للاستقرار والشفافية بدلاً من مطاردة أعلى قيمة أداء فردية من شبكات نمط الصور التي لم تُصمم أصلاً لمثل هذه المدخلات.

الاستشهاد: Wang, C., Elgendi, M. & Shin, H. Instability and performance limits of convolutional neural networks on non-sequential medical tabular data: an empirical investigation. Sci Rep 16, 11914 (2026). https://doi.org/10.1038/s41598-026-39875-9

الكلمات المفتاحية: البيانات الطبية الجدولية, الشبكات العصبية التلافيفية, الشبكات متعددة الطبقات, نماذج التنبؤ السريرية, ثبات النموذج