Clear Sky Science · ar

إطار هجيني LSTM-GRU لتصنيف سرطان الرئة باستخدام خوارزمية GWO-WOA لضبط المعاملات الفائقة وBPSO لاختيار الميزات

· العودة إلى الفهرس

لماذا هذا مهم للصحة اليومية

يمكن أن يؤدي اكتشاف سرطان الرئة في مراحله المبكرة إلى إنقاذ الأرواح، لكن العديد من الأشخاص لا يحصلون على فحوص متقدمة إلا بعد فوات الأوان. تستكشف هذه الدراسة ما إذا كان يمكن دمج فحوص بسيطة تعتمد على الأسئلة — حول العمر، والتدخين، والأعراض، والعادات اليومية — مع تقنيات الذكاء الاصطناعي الحديثة لاكتشاف الأشخاص المعرضين لمخاطر عالية قبل ظهور المرض الشديد بفترة طويلة. من خلال الاستفادة القصوى من الاستبانات منخفضة التكلفة والنماذج الحاسوبية الذكية، يشير هذا العمل إلى أدوات فحص أسرع وأكثر وصولاً قد تدعم الأطباء وبرامج الصحة العامة عالمياً في المستقبل.

Figure 1
الشكل 1.

تحويل الأسئلة البسيطة إلى إشارات مفيدة

عمل الباحثون مع مجموعتي بيانات عامتين من موقع Kaggle، تغطيان معاً أكثر من 3300 شخص. بدلاً من الصور الطبية، تحتوي كل سجلات على 15 بنداً قد تراها في استمارة عيادة: العمر، الجنس، حالة التدخين، اصفرار الأصابع، السعال، ضيق التنفس، ألم الصدر، وعوامل ومظاهر خطر مماثلة، بالإضافة إلى تسمية توضح ما إذا كان سرطان الرئة موجوداً. وبما أن بيانات الاستبيانات الواقعية عادة ما تكون فوضوية، قام الفريق أولاً بتنقية المعلومات عن طريق تصحيح القيم المفقودة وإزالة السجلات المكررة ومزامنة طريقة ترميز الإجابات عبر المجموعتين. كما عدلوا القيم بحيث تكون جميع الميزات على مقياس مشابه واستخدموا طريقة موازنة لتصحيح الانحياز القوي نحو حالات السرطان في مجموعة البيانات الأصغر، الأمر الذي ساعد النموذج على تجنّب الانحياز نحو التنبؤ بالفئة الأكثر عدداً فقط.

ترك للحاسوب اختيار الأسئلة الأكثر دلالة

ليست كل الأسئلة في الاستمارة مفيدة بنفس الدرجة لاكتشاف المرض، واستخدام عدد كبير منها قد يربك النموذج فعلياً. للتركيز على ما يهم حقاً، استخدم المؤلفون استراتيجية بحث مستوحاة من أسراب تسمى تحسين الجسيمات الثنائي (BPSO). ببساطة، يتم اختبار العديد من «مجموعات الأسئلة» المحتملة بشكل متوازي، وتتحرك هذه المجموعات عبر فضاء الاحتمالات، مقلدة ومحسنة لأفضل الأداءات. مع مرور الوقت، استقرت العملية على مجموعات مدمجة بحوالي سبعة أسئلة رئيسية، مع إبراز متكرر لميزات مثل التدخين، اصفرار الأصابع، السعال، ألم الصدر، الصفير، ضيق التنفس، والأمراض المزمنة. هذه المجموعات المركزة حسّنت الدقة بعدة نقاط مئوية مقارنة باستخدام جميع الأسئلة الخمسة عشر، كما جعلت النموذج النهائي أسهل تفسيراً وأسرع في التشغيل.

Figure 2
الشكل 2.

محرك أكثر ذكاءً لقراءة الأنماط في الإجابات

لتحويل إجابات الاستبيان إلى توقع بنعم أو لا لوجود السرطان، بنى الفريق نموذجاً هجينا يمزج وحدتين متعلقتين في التعلّم العميق تُستخدمان عادةً للتسلسلات: الذاكرة طويلة قصيرة المدى (LSTM) والوحدة العودية البوّابة (GRU). رغم أن إجابات الاستبيان ليست سلسلة زمنية مثل الكلام أو الفيديو، فإن مجموعات الأعراض والعادات تشكل أنماطاً يمكن معاملتها كسلاسل قصيرة. يمرر النموذج أولاً الأسئلة المختارة عبر طبقات LSTM التي تستطيع تخزين ونسيان المعلومات بشكل انتقائي، ثم عبر طبقات GRU التي تصقل هذه الأنماط بخطوات داخلية أقل وتكلفة حوسبية أقل. ولتجنّب التصميم بالتجربة والخطأ، ضبط المؤلفون إعدادات حاسمة — مثل معدل التعلم، وعدد الوحدات المخفية، وحجم الدفعة، ومعدل الإسقاط — باستخدام طبقة ثانية من البحث المستوحى من الطبيعة تمزج بين الاستكشاف الواسع لـ«الذئاب الرمادية» والتعديلات الدقيقة لـ«الحيتان». يبحث هذا المحسّن المزدوج عن تراكيبات من المعاملات الفائقة التي تعطي دقة عالية باستمرار خلال التحقق المتقاطع.

كيف أدّى النظام

بعد التدريب، اختُبر النموذج الهجين LSTM–GRU مقابل عدة خطوط أساس قوية، بما في ذلك شبكات LSTM وGRU منفردة، وشبكة عصبية تلافيفية، وآلات ناقل الدعم التقليدية، وطرق قائمة على الأشجار مثل الغابات العشوائية والتدرّج التعزيزي. على مجموعة البيانات الأصغر المكونة من 309 أشخاص، صنّف النظام المقترح كل حالة بشكل صحيح في مجموعة الاختبار المحجوزة، محققاً دقة وقياس دقّة واسترجاع وF1 بنسبة 100%. وعلى مجموعة البيانات الأكبر المكونة من 3000 شخص، ظل قريباً من الكمال، بحوالي 99.3% دقة ودرجات مرتفعة مماثلة عبر المقاييس الأخرى، متفوقاً على جميع النماذج العميقة والكلاسيكية المنافسة. أظهر المؤلفون أيضاً أن استراتيجيتهم ذات المرحلتين — اختيار الأسئلة أولاً بواسطة بحث السرب، ثم ضبط الشبكة الهجينة بواسطة محسن الذئاب‑والحيتان — أعطت نتائج أكثر استقراراً عبر تكرارات التحقق المتقاطع مقارنة بالإعدادات الأبسط.

ماذا يعني هذا لفحص الرئة مستقبلاً

بعبارة بسيطة، تُظهر هذه الدراسة أن نظاماً ذكياً مصمماً بعناية يمكنه قراءة إجابات استبيان عادية وفصل الأشخاص المصابين بسرطان الرئة عن غير المصابين بدقة عالية في مجموعات البيانات المعيارية. لا يحل هذا محل الفحوص التصويرية أو الأطباء أو التجارب السريرية، ويؤكد المؤلفون أن بياناتهم محدودة وليست جاهزة بعد للاستخدام المباشر في المستشفيات. ومع ذلك، يبيّن النهج أن الجمع بين اختيار الأسئلة الذكي ومحركات التعلّم العميق المضبوطة بعناية يمكن أن يحوّل الاستمارات منخفضة التكلفة إلى أدوات إنذار مبكر قوية. مع اختبارات إضافية على مجموعات أكبر ومنسقة سريرياً وطرق شرح أفضل لتوضيح سبب وسم النموذج لشخص ما بأنه عالي الخطر، قد تساعد أنظمة مماثلة يوماً ما في اتخاذ قرار إحالة من ينبغي أن يخضع لتصوير أكثر تفصيلاً، داعمةً التشخيص المبكر مع الحفاظ على فحوص ميسورة وغير غازية.

الاستشهاد: Amrir, M.M.S., Ayid, Y.M., Elshewey, A.M. et al. A hybrid LSTM-GRU framework for lung cancer classification using GWO-WOA algorithm for hyperparameter tuning and BPSO for feature selection. Sci Rep 16, 8600 (2026). https://doi.org/10.1038/s41598-026-39020-6

الكلمات المفتاحية: فحص سرطان الرئة, بيانات الاستبيان, التعلّم العميق, اختيار الميزات, الذكاء الاصطناعي الطبي