Clear Sky Science · ar

شبكة انتباه ذات فرعين مع تلافيف انقسام عميق ومحوّلات متعددة الأبعاد لتجزئة الصور الطبية

· العودة إلى الفهرس

رؤى أوضح للأطباء

تفصح الفحوص الحديثة عن الأورام والأوعية المسدودة والأعضاء التالفة بتفاصيل مذهلة، لكن تحويل تلك الصور الرمادية إلى حدود واضحة يمكن للحاسوب فهمها لا يزال أمراً صعباً بشكل مدهش. يحتاج الأطباء إلى حدود دقيقة حول الأعضاء والأنسجة المريضة لتخطيط الجراحة، ومتابعة العلاج، وتجنّب الأخطاء. تقدم هذه الدراسة نظام ذكاء اصطناعي جديداً، يُدعى D3T-Net، يرسم تلك الحدود بدقة وموثوقية أكبر مقارنة بالعديد من الأساليب الرائدة، مما قد يخفف عبء عمل أخصائيي الأشعة ويعزّز الثقة التشخيصية.

Figure 1
الشكل 1.

لماذا رسم الخطوط على الفحوص الطبية صعب جداً

عندما ينظر أخصائي الأشعة إلى صورة مقطعية أو أشعة سينية، فإنه يفصل ذهنياً البُنى المتداخلة، ويتجاهل الضوضاء، ويستدل على الحواف المفقودة. البرامج الحاسوبية التقليدية تكافح في ذلك، خصوصاً حين تختلف أشكال الأعضاء من شخص لآخر، أو حين يكون حد الورم طمساً. الأنظمة السابقة المبنية على الشبكات الالتفافية تجيد التقاط النماذج المكانية والحواف المحلية، لكنها تميل إلى رؤية حيّز صغير فقط في كل مرة. هذا يجعلها عرضة لفقدان السياق الأوسع الضروري لتمييز، مثلاً، حافة ورم خافت عن نسيج طبيعي. من ناحية أخرى، نماذج "المحوّل" الحديثة متقنة في التقاط العلاقات بعيدة المدى عبر الصورة بأكملها، لكنها غالباً ما تتهاون في التفاصيل الدقيقة مثل الآفات الصغيرة أو الحواف الرقيقة.

طريقتان متكاملتان للرؤية

يتعامل D3T-Net مع هذا التحدي بدمج الطريقتين في شبكة واحدة متناسقة بإحكام. يتصرف فرع واحد كمحلل صور تقليدي، يركّز على رقع صغيرة لالتقاط النَسج الدقيقة والحواف الواضحة. يستخدم استراتيجية "الانقسام العميق": تُقسّم ميزات الصورة الواردة إلى مسارات موازية متعددة، تُعالَج بشكل منفصل، ثم تُدمج عبر آلية انتباه تقرر أي المسارات تحمل المعلومات البنائية الأكثر فائدة. أما الفرع الآخر فيتصرف كمراقب شامل، مستخدماً انتباهاً على غرار المحوّل لمقارنة أجزاء بعيدة من الصورة وفهم علاقة المناطق ببعضها. ينظر هذا الفرع ليس فقط عبر مستوى الصورة بل أيضاً عبر قنوات الميزات، مما يتيح له التقاط مواضع العناصر وكذلك نماذج ظهورها.

جعل الفرعين يتعاونان

ليس كافياً تشغيل فرعين بالتوازي فحسب؛ بل يجب أن يتبادلا المعلومات بذكاء. في جزء التشفير من D3T-Net، يفحص وحدة تفاعل خاصة الأنماط من اتجاهات متعددة عبر الصورة، مستخدمة التجميع والانتباه لتسليط الضوء على البُنى الأكثر معلوماتية — مثل مخططات الأعضاء أو نوى الآفات — ومشاركة هذا التركيز بين الفرعين المحلي والعالمي. في جزء فك التشفير، حيث يُجمَع خريطة التجزئة النهائية، تتعلم آلية انتباه عابرة كيف تدمج ما تعلمه كل فرع، مع إعادة تنظيم الميزات بحيث يعمّق السياق العالمي الحواف المحلية وتُحسّن التفاصيل المحلية الصورة العالمية الشاملة. روابط الانتقال متعددة المقاييس تنقل المعلومات من المراحل المبكرة عالية الدقة مباشرة إلى المراحل اللاحقة، مما يساعد النظام على تتبع الأجسام الصغيرة والحواف الرقيقة التي قد تُفقد خلاف ذلك.

Figure 2
الشكل 2.

اختبارات على الأعضاء والجلد والرئتين

اختبر الباحثون D3T-Net على ثلاث مهام طبية مختلفة للغاية: تحديد محيط الأعضاء البطنية في صور مقطعية، وتتبع آفات الجلد في صور سريرية، وتجزيء الرئتين في أشعة الصدر. عبر مقاييس الدقة وحدّة الحواف القياسية، تفوّق D3T-Net باستمرار على مجموعة واسعة من أنظمة الحالة‑الفنية، بما في ذلك متغيرات U‑Net المعروفة والأنظمة الهجينة المبنية على المحوّل. كان قويّاً بشكل خاص في الحفاظ على استمرارية محيطات الأعضاء، وفصل البُنى المجاورة بشكل صحيح، والتقاط الأهداف الصغيرة أو منخفضة التباين مثل المرارة أو الآفات الجلدية غير المنتظمة. والأهم أن هذه المكاسب تحققت دون زيادة كبيرة في زمن الحوسبة: بقيت تكلفة معالجة النموذج قابلة للمقارنة مع العديد من الشبكات واسعة الانتشار، مما يجعل نشره في العيادات أمراً وارداً.

ماذا يعني هذا للمرضى والممارسين

بعبارات بسيطة، تُظهر الدراسة أن السماح لخوارزمية "بالتفكير" محلياً وعالمياً في آن واحد يؤدي إلى حدود أنظف للأعضاء والأمراض على الصور الطبية. عبر تنسيق فرع موجه للتفاصيل مع فرع واعٍ بالسياق بشكل مدروس، يستطيع D3T-Net فصل النسيج السليم عن المريض بدقة أكبر من العديد من الأدوات الحالية. وبينما لن يحلّ محل الأطباء المختصين بالأشعة، يمكن أن يعمل كمساعد قوي — إذ يقوم بتجزئة الفحوص تلقائياً، وينبّه إلى الآفات الدقيقة، ويوفر أقنعة أكثر موثوقية لمهام لاحقة مثل التخطيط ثلاثي الأبعاد أو مراقبة العلاج. ومع تطبيق تصاميم الرؤية المزدوجة المماثلة على مشكلات تصوير أخرى، قد يستفيد المرضى من رعاية أسرع وأكثر اتساقاً وشخصنة.

الاستشهاد: Li, D., Yuan, C., Yao, Y. et al. Dual-branch attention network with deep split convolution and multi-dimensional transformers for medical image segmentation. Sci Rep 16, 14238 (2026). https://doi.org/10.1038/s41598-026-44413-8

الكلمات المفتاحية: تجزئة الصور الطبية, التعلّم العميق, شبكات المحوّل, تحليل الكبد والأعضاء, التشخيص بمساعدة الحاسوب