Clear Sky Science · ar
R3MV: بنية نظام موثوقة جديدة لتصنيف سرطانات الجلد باستخدام نموذج متعدد الكتل التقدمي غير المتجانس
لماذا يهمك هذا البحث لبشرتك
يُعد سرطان الجلد من أكثر السرطانات شيوعًا على مستوى العالم، والكشف المبكر قد يفرق بين إجراء بسيط ومرض يهدد الحياة. يتجه أطباء الجلدية بشكل متزايد إلى الذكاء الاصطناعي لمساعدة في اكتشاف الشامات الخطرة في الصور المأخوذة بالكاميرات أو الديرموسكوبات. ولكن إذا اختلفت أنظمة الذكاء الاصطناعي المختلفة حول نفس البقعة الجلدية، فأيها يجب أن يثق به الطبيب؟ تُقدّم هذه الدراسة طريقة جديدة لدمج عدة وجهات نظر ذكاء اصطناعي في قرار واحد أكثر موثوقية حول ما إذا كانت الآفة سرطانية أم لا.

مشكلة الثقة بجهاز ذكي واحد
تعتمد معظم أدوات الذكاء الاصطناعي الحالية لتشخيص سرطان الجلد على تدريب نموذج قوي واحد على مجموعة بيانات واحدة. قد تبدو هذه الأنظمة رائعة في اختبارات المختبر، لكن أداؤها غالبًا ما يتراجع عند رؤية صور من عيادات أو كاميرات أو مجموعات مرضى جديدة. أبرزت التقييمات السابقة في مجال الأمراض الجلدية ضعف التحقق الخارجي وسوء التعميم: فالنماذج التي تؤدي جيدًا على مجموعة بيانات مُنقحة بعناية قد تتعثر في المستشفيات الواقعية. وبما أن الإجابة الخاطئة قد تؤخر العلاج أو تتسبب في خزعات غير ضرورية، يجادل المؤلفون بأن الاعتماد على أي نموذج واحد يمثل مخاطرة في اتخاذ القرار السريري.
نظام تصويت متعدد الأصوات جديد
لمعالجة ذلك، يقترح الباحثون بنية ثلاثية المستويات تُسمى R3MV، واختصارها نظام تصويت أغلبية موثوق ثلاثي المستويات. بدلًا من سؤال نموذج ذكاء اصطناعي واحد عن الإجابة، يقوم R3MV بتمرير نفس صورة الجلد عبر ثلاث مسارات قرار مختلفة. المسار الأول يستخدم شبكة عصبية التلافيفية العميقة لتصنيف الصورة مباشرة. المسار الثاني يُغذّي عدة شبكات عميقة مختلفة، يدمج الأنماط التي تكتشفها، ويُمرّر هذه الميزات المقطرة إلى مصنف تقليدي. المسار الثالث ينظر إلى التنبؤات التي قدمتها نماذج فردية متعددة ويدرب مصنفًا آخر على هذه المخرجات. أخيرًا، يأخذ النظام تصويت الأغلبية عبر المسارات الثلاثة، بحيث يعكس الحكم النهائي إجماعًا بدلاً من رأي واحد.
طريقة أذكى لقراءة صور الجلد
في قلب المسار الأول يوجد نموذج صور مخصص يُسمى الشبكة التلافيفية متعددة الكتل غير المتجانسة التقدمية (PHMBCNN). تُبنى هذه الشبكة من عدة كتل متخصصة يبرز كل منها جوانب بصرية مختلفة من الآفة، مثل القوام الدقيق أو البنى الأوسع، بترتيب تقدمي من الطبقات السطحية إلى العميقة. يعزّز المؤلفون هذا النموذج بإضافة وحدة ذاكرة متسلسلة مسماة بوابة الذاكرة المتكررة (GRU)، وهي نوع من وحدات الذاكرة التي تساعد الشبكة على التقاط العلاقات عبر القنوات والطبقات. النسخة المطورة هذه، PHMBCNN-GRU، تعمل كمصنّف قوي مستقل وكذلك كمصدر ميزات مهم للمسارات الأخرى في النظام.
إتاحة تعلم نماذج متعددة معًا
يركز المسار الثاني على دمج نقاط القوة من شبكات صور متنوعة. تُمرَّر نفس صورة الآفة عبر PHMBCNN-GRU وعدة نماذج مُدرجة مسبقًا مشهورة طُورت في الأصل للصور الفوتوغرافية العامة. يستخرج كل نموذج "بصمة" عالية الأبعاد خاصة به للآفة. تُدمج هذه البصمات معًا ثم تُضغط باستخدام تقنيات تزيل المعلومات المكررة أو غير المفيدة، محتفظةً فقط بالميزات الأكثر إفادة. بعد ذلك يتعلم متعدّد الطبقات الإدراكي (MLP)، وهو شبكة عصبية طبقية كلاسيكية، تصنيف الآفات بناءً على هذا الوصف المشترك المنقّح، مُمزجًا بفعالية ما "ترى"ه كل نموذج في رؤية واحدة أوضح.

تحويل الخلافات إلى إجابة أقوى
المسار الثالث، المسمى دمج على مستوى القرار، يتبنّى منظورًا عالي المستوى أكثر. هنا يعامل المؤلفون كل تسمية متوقعة من نموذج ما كمدخل ويعلّمون آلة ناقلات الدعم (SVM) للتعرّف على أنماط الاتفاق والاختلاف بين النماذج. يتعلم هذا المصنف الأعلى، على سبيل المثال، متى تشير تركيبات نماذج معينة عادةً إلى بقعة حميدة أو متى يميل نموذج محدد إلى الخطأ في أنواع آفات معينة. عبر المسارات الثلاثة، قام الباحثون بعمليات معالجة مسبقة دقيقة للصور—تغيير الحجم، إزالة شوائب الشعر، وموازنة الفئات—لتعكس بشكل أفضل واقع الصور السريرية الفوضوي المأخوذة بواسطة الديرموسكوبات والهواتف الذكية على حد سواء.
مدى أداء النظام عمليًا
اختبر الفريق نهجهم على مجموعتين شائعتين من صور سرطان الجلد: HAM10000، التي تحتوي على صور ديرموسكوبي عالية الجودة من مراكز سريرية، وPAD_UFES_20، التي تشمل صورًا من الهواتف الذكية تحتوي على شوائب أقوى مثل الشعر الكثيف وعلامات الحبر. حسّن نموذج PHMBCNN-GRU المحسّن الدقة بمفرده مقارنةً بالإصدار الأساسي على كلتا مجموعتي البيانات. والأهم من ذلك أن الجمع بين المسارات الثلاثة عبر تصويت الأغلبية في نظام R3MV زاد الأداء أكثر، فبلغت الدقة نحو 99٪ على HAM10000 وحوالي 82٪ على PAD_UFES_20. كما أن إزالة الشعر من الآفات حسّنت النتائج باستمرار، مما يبيّن أهمية التنظيف الدقيق للصور للتشخيص الآلي.
ماذا يعني هذا لفحوصات الجلد المستقبلية
لغير المختصين، الرسالة الرئيسية هي أن هذا العمل يحوّل الذكاء الاصطناعي لتشخيص سرطان الجلد من "صندوق أسود" واحد إلى لوحة من "الآراء" المستقلة التي يجب أن تتفق قبل إشعار الآفة بأنها مريبة. ورغم أن R3MV لا يحل بالكامل تحدّي جعل نظام واحد يعمل على نحو متسق في جميع العيادات وأنواع الكاميرات، فإنه يبرهن أن مزج نماذج مختلفة والتصويت بينها يمكن أن يولّد إجابات أكثر موثوقية من الاعتماد على نموذج واحد فقط. مع مرور الوقت، قد تدعم مثل هذه الأنظمة متعددة المسارات أطباء الجلدية بتقديم تقييمات أكثر استقرارًا، قابلية تفسير وثقة بشأن أي البقع الجلدية تستحق اهتمامًا أقرب أو خزعة.
الاستشهاد: Reshma, S.K., Reeja, S.R. R3MV: a novel reliable system architecture for skin cancer classification using progressive heterogeneous multiblock model. Sci Rep 16, 13599 (2026). https://doi.org/10.1038/s41598-026-40522-6
الكلمات المفتاحية: كشف سرطان الجلد, الذكاء الاصطناعي في الأمراض الجلدية, تجميعات التعلم العميق, تحليل الصور الطبية, التشخيص بمساعدة الحاسوب