Clear Sky Science · ar

UNet متوازٍ يدمج KAN وmamba لتجزئة الصور الطبية

2026-03-15 · العودة إلى الفهرس

لماذا يهم هذا المرضى والأطباء

خلف كل فحص تصوير للكشف عن السرطان أو صورة بالموجات فوق الصوتية، هناك خطوة حاسمة تتمثل في تعليم الحواسيب على تحديد مكان الآفة أو العضو بدقة. تُسمى هذه العملية التجزئة، وهي تساعد الأطباء في قياس الأورام، ومتابعة المرض، وتخطيط العلاج. يقدم البحث شبكة جديدة باسم KMP-UNet، وهي نوع مضغوط من شبكات تحليل الصور تعد بتتبع هذه الحواف بدقة وكفاءة أعلى، مما قد يجعل قراءة الصور الطبية الآلية أكثر موثوقية وأسهل للنشر في العيادات الحقيقية.

رؤية الصورة كاملة في الفحص الطبي

الصور الطبية الحديثة كبيرة ومعقدة: قد تنتشر الدلائل المهمة عبر مساحة واسعة، بينما قد تكون حواف الآفة نفسها ضبابية أو غير منتظمة. شبكات الالتفاف التقليدية، بما في ذلك عائلة UNet الشهيرة، جيدة في اكتشاف الأنماط المحلية لكنها تواجه صعوبة في ربط مناطق بعيدة داخل الفحص. النماذج المبنية على المحولات قادرة على رؤية الصورة كاملة دفعة واحدة لكنها تميل لأن تكون ثقيلة وبطيئة، وهو ما يسبب مشاكل مع بيانات عالية الدقة ومعدات محدودة في المستشفيات. يبني المؤلفون على فئة أحدث من نماذج التسلسل تُعرف بنماذج الحالة الزمنية، ونمط حديث من الشبكات العصبية يدعى شبكات كولموغوروف–أرنولد، لالتقاط كل من السياق الواسع والتفاصيل الدقيقة دون تضخيم التكلفة الحسابية.

خبيران ذكيان يعملان جنبًا إلى جنب

تحافظ KMP-UNet على بنية الترميز–فك الترميز على شكل حرف U المعهودة في UNet لكنها تغير ما يحدث داخلها. بدلاً من الاعتماد على نوع واحد من المعالجة، تُشغّل الشبكة فرعين متوازيين. يعتمد أحد الفروع على نموذج يسمى Mamba، الذي يتفوق في معالجة التسلسلات الطويلة وتم تكييفه هنا للمسح عبر الصورة. يجمع هذا الفرع السياق بعيد المدى بكفاءة، مما يساعد الشبكة على فهم كيف ترتبط المناطق البعيدة ببعضها. الفرع الثاني يستخدم شبكات كولموغوروف–أرنولد، التي تستبدل دوال التنشيط الثابتة بمنحنيات قابلة للتعلّم ومرنة. يمنح ذلك النموذج قدرة إضافية على تمثيل الأنماط غير الخطية المعقدة، مثل تغيرات الدرجة الدقيقة على طول حافة آفة جلدية أو زائدة لحمية.

دمج أذكى للميزات وحدود أوضح

ربط أنواع نماذج مختلفة فحسب لا يكفي؛ التحدي الحقيقي هو كيفية دمج نقاط قوتها. لذلك قدم المؤلفون كتلة موازية تسمى كتلة Mamba الالتفافية المتوازية (PCMB)، التي تقسم الميزات إلى مجموعات وتعالجها عبر عدة مسارات خفيفة قائمة على Mamba والالتفاف قبل دمجها مرة أخرى. يوازن هذا التصميم بين السياق العالمي والتفاصيل الدقيقة مع إبقاء تكلفة الحساب منخفضة. كما أعادوا التفكير في وصلات التخطي التي تربط المُرمّز والمُفكّك. وحدة الانتباه المحسّنة المكانية-القناتي (ESCA) تُبرز انتقائياً المواقع والقنوات المهمة للميزات، مع الحفاظ على المعلومات المفيدة عبر وصلات متبقية. يجعل هذا الشبكة أقل عرضة للالتباس بعوامل إلهاء مثل الشعر، أو الوهج، أو الخشونة المزعجة حول الآفة.

ما مدى فاعلية الاقتراح الجديد؟

قيّم الفريق KMP-UNet على أربع مجموعات بيانات عامة تغطي آفات الجلد، وزوائد القولون، وصور الموجات فوق الصوتية للثدي، واختبروا أيضاً النقل إلى مجموعة بيانات جلدية أخرى. عبر هذه المقاييس، يطابق النموذج أو يتفوق باستمرار على مجموعة من الأساسيات القوية، بما في ذلك متغيرات UNet الكلاسيكية، وتصاميم مبنية على المحولات، وشبكات حديثة مُعزّزة بـMamba وKAN. على سبيل المثال، على مجموعة بيانات شائعة لآفات الجلد (ISIC2018)، يحقق KMP-UNet درجة Dice ودقة عالية بينما يستخدم نحو مليون معلمة فقط—أقل بكثير من العديد من المنافسين. تظهر تجارب مفصلة أن كل مكوّن—نمذجة السياق المبنية على Mamba، والتنقية غير الخطية المبنية على KAN، وتحسينات التخطي المبنية على ESCA—يساهم بمكاسب قابلة للقياس، خصوصاً في جودة الحدود وتقليل المناطق الإيجابية الكاذبة.

ماذا يعني هذا لأدوات الذكاء الاصطناعي الطبية المستقبلية

لغير المتخصصين، الخلاصة أن KMP-UNet يقدم طريقة أكثر تماسُكاً وقوة لتعليم الحواسيب تحديد الآفات والأعضاء في الصور، من خلال السماح لخبيرَين متكاملين بالعمل متوازيًا ثم دمج رؤاهما بعناية. ورغم أن الطريقة لا تزال تواجه صعوبات في أصعب الحالات—الأشكال غير المنتظمة للغاية، والحواف المشوشة بشدة، أو الشوائب الكثيفة—إلا أنها توفر أساسًا قويًا للتجزئة الدقيقة والفعّالة. مع مزيد من العمل على التعامل مع الخلفيات المزعجة والتكيّف عبر مراكز التصوير المختلفة، قد تساعد مقاربات مثل KMP-UNet على تقريب تحليلات الصور السريعة والموثوقة من التطبيق السريري اليومي.

الاستشهاد: Liu, J., Wu, J., Xu, L. et al. A parallel UNet integrating KAN and mamba for medical image segmentation. Sci Rep 16, 13579 (2026). https://doi.org/10.1038/s41598-026-43127-1

الكلمات المفتاحية: تجزئة الصور الطبية, التعلّم العميق, UNet, نماذج الحالة الزمنية, شبكات كولموغوروف–أرنولد