Clear Sky Science · ar
تقليص الصور الطبية الضخمة عبر شبكات عصبية عميقة تفصل الشكل عن الملمس
لماذا يهم تقليص الصور الطبية
تعتمد المستشفيات الحديثة على أعداد كبيرة من الفحوصات ثلاثية الأبعاد المفصّلة من أجهزة الأشعة المقطعية والرنين المغناطيسي. هذه الصور ضرورية للتشخيص والبحث، لكنها ضخمة: قد يشغل كل مجموعة بيانات مئات الغيغابايت، ما يجعل تخزينها ومشاركتها وتحليلها بطيئًا ومكلفًا. يقدم هذا البحث طريقة جديدة لتقليص هذه الملفات الضخمة بشكل كبير مع الحفاظ على التفاصيل التشخيصية إلى حد كبير، ما قد يسرع العمل السريري، والاستشارات عن بُعد، والدراسات الطبية واسعة النطاق.
نوعان من المعلومات في فحص واحد
عند الاطلاع على فحص للجسم، ترى في الواقع نوعين مختلفين من المعلومات في آن واحد. الأول هو الشكل العام للأعضاء والعظام — أين ينحني العمود الفقري، حجم الكبد، توزيع البطن. والثاني هو الملمس الدقيق — التغيرات الطفيفة في السطوع التي تشير إلى أنواع الأنسجة أو أمراض خفيفة. يجادل المؤلفون أن معظم أدوات الضغط الحالية تتعامل مع هذين العنصرين كما لو كانا مختلطين، ما يجعل الضغط أبطأ وأقل كفاءة. الفكرة الأساسية هنا هي فصل الشكل عن الملمس وضغط كل منهما باستراتيجية تناسبه أفضل.

مخطط معياري للجسم
الأسلوب الجديد، المسمى ضغط الشكل-الملمس المفصّل (DeepSTD)، يبدأ باختيار "قالب" لفحص منطقة من الجسم ونوع التصوير، مثل CT للجذع أو MRI للبطن. يعمل هذا القالب كخريطة معيارية لتلك التشريح. لكل فحص جديد، يحدد DeepSTD أولًا كيف ينبغي أن يُشوه جسم المريض بسلاسة ليصطف مع القالب. يصف حقل التشويه هذا فروق الشكل: ربما مريض أطول، أو كبد مُزاح قليلًا، أو عمود فقري بانحناء مختلف. يمثل المؤلفون حقل التشويه هذا باستخدام نوع مدمج من الشبكات العصبية المتفوقة في ترميز التشوهات ثلاثية الأبعاد السلسة، حتى يمكن تخزين معلومات الشكل بكفاءة.
التقاط الملمس الدقيق بعد المحاذاة
بمجرد أن يُحوَّل الفحص ليطابق شكل القالب، يبقى في الغالب فروق الملمس — أنماط الشدة الدقيقة التي تميّز مريضًا عن آخر. ولأن جميع الفحوص الآن في نفس التخطيط الهندسي، تصبح هذه الملمسات أسهل في النمذجة والضغط. يمرر DeepSTD البيانات الممحوكة إلى شبكة عصبية ثانية تمزج بين طبقات التفاف (مناسبة للتفاصيل المحلية) وكتل Transformer (مناسبة لالتقاط البنية طويلة المدى) في كامل الفضاء ثلاثي الأبعاد. تتعلم هذه الشبكة، من العديد من الأمثلة، أي تفاصيل الملمس شائعة وأيها فريد، مما يسمح لها بتخزين الأساسيات فقط في "رمز كامن" مضغوط. الملف المضغوط النهائي هو ببساطة رمز الشكل زائد رمز الملمس.
الاختبار على مجموعات CT و MRI حقيقية
اختبر الفريق DeepSTD على مجموعات بيانات عامة كبيرة، بما في ذلك فحوصات CT مفصّلة للعمود الفقري وحجوم MRI للبطن. قارنوه مع أدوات تقليدية (كـ JPEG وHEVC ومعايير الفيديو الأحدث) ومع طرق عصبية متقدمة. عند مستويات ضغط تصل إلى تصغير بحجم يصل إلى 256 مرة أقل من الملفات الأصلية، حافظ DeepSTD على التشابه على مستوى البكسل والميزات المهمة طبيًا، مثل تقسيم الأعضاء الآلي، أفضل بكثير من البدائل. في الوقت نفسه، شفّر النظام الفحوص بعشرات وحتى مئات المرات أسرع من أفضل نظام ضغط عصبي سابق قائم على التمثيلات العصبية الضمنية وحدها. عمليًا، مجموعة بيانات CT كانت تستغرق أيامًا للتنزيل عبر اتصال بطيء قد تُنقل خلال أقل من نصف ساعة باستخدام DeepSTD، مع فقدان مرئي يكاد يكون معدومًا.

مصمم للاستخدام السريري اليومي
بعيدًا عن الأرقام البحتة، صمم المؤلفون DeepSTD مع مراعاة قيود العالم الحقيقي. يمكن للطريقة أن تستخدم بطاقات رسومية متعددة بالتوازي، مما يقلل أوقات الترميز وفك الترميز لمجموعات كبيرة. تتيح تحكمًا دقيقًا في نسبة الضغط، بحيث يمكن للمستشفيات ملاءمة حجم الملفات مع مساحة التخزين المتاحة أو عرض النطاق الشبكي. كما يعمل النظام عندما تكون بيانات التدريب محدودة، بفضل تكبير البيانات وتقنيات "تقليص المعرفة" التي تنقل ما تعلَّم من مجموعات بيانات أغنى. تشير الاختبارات على صور الأشعة الصدرية الإضافية وفحوصات MRI للدماغ والركبة إلى أن المنهجية قابلة للتطبيق عبر أنواع تصوير مختلفة.
ماذا يعني هذا للمرضى والأطباء
لغير المتخصصين، الخلاصة بسيطة: DeepSTD هو طريقة أذكى لتجميع الصور الطبية. من خلال ترميز شكل جسم المريض ومظهر أنسجته بشكل منفصل، يضغط الفحوص بأكثر من مئة ضعف بينما يحافظ على المعلومات التي يعتمد عليها الأطباء والخوارزميات. قد يسهل ذلك بشكل كبير تخزين سجلات التصوير على المدى الطويل، ومشاركة البيانات بين المستشفيات، وإجراء دراسات ذكاء اصطناعي واسعة النطاق، كل ذلك دون التضحية بالجودة التشخيصية.
الاستشهاد: Yang, R., Xiao, T., Cheng, Y. et al. Reducing bulky medical images via shape-texture decoupled deep neural networks. Nat Commun 17, 1573 (2026). https://doi.org/10.1038/s41467-026-68292-9
الكلمات المفتاحية: ضغط الصور الطبية, التعلّم العميق, بيانات CT و MRI, تمثيل عصبي, تخزين بيانات صحية