Clear Sky Science · ar
نماذج متعددة النمط لتصنيف سرطان الجلد باستخدام نصوص سريرية حرة الصور الجلدية المجهريّة
لماذا تهم فحوصات الجلد الأذكى
سرطان الجلد شائع، ولكن عندما يُكتشَف مبكراً، يحقق المرضى عادةً نتائج جيدة جداً. يستخدم الأطباء بالفعل صوراً مقربة للشامات لتقرير أيها تبدو مقلقة. تطرح هذه الدراسة سؤالاً بسيطاً له تداعيات كبيرة: إذا أصبح بإمكان الحواسيب أيضاً قراءة ملاحظات الطبيب حول كل شامة، وليس الصور فحسب، فهل ستتمكن من كشف سرطانات الجلد بدقة وعدالة أكبر؟

الصور والكلمات تروي صورة أكثر اكتمالاً
بنى الباحثون مجموعة بيانات كبيرة من عيادات الأمراض الجلدية الروتينية في المملكة المتحدة. شملت 5481 صورة مجهرية مقربة من 4538 بالغاً، إلى جانب بيانات أساسية للمريض مثل العمر ونوع الجلد، وأربعة أنواع من الملاحظات السريرية. غطّت هذه الملاحظات كيف بدا الورم وتغير مع الوقت، وما إذا كان سرطان الجلد موجوداً في العائلة، ومدى تعرض الشخص للشمس، وما رأى الجراح وخططه. ووسّم كل حالة بأنها حميدة أو خبيثة، وكانت الحالات الخبيثة مؤكّدة بواسطة خزعة كلما أمكن ذلك.
دلائل خفية داخل الملاحظات السريرية
على عكس بيانات مربّعات الاختيار البسيطة، يتيح النص الحر للأطباء وصف خصائص دقيقة: شامة أصبحت أغمق، نقطة تنزف، أو مريض عمل في الهواء الطلق لسنوات. مثل هذه التفاصيل قد تكون غنية بالمعلومات، لكنها قد تكشف الإجابة أيضاً. تحتوي العديد من الملاحظات على ما يسميه المؤلفون لغة مُرشِدة: عبارات تُصرح أو تُلمّح بقوة إلى التشخيص أو العلاج، مثل «سرطان الخلايا القاعدية، إحالة للخزعة» أو «لا علاج مطلوب». إذا اعتمد نموذج تعلّم آلة ببساطة على هذه الاختصارات، فقد يبدو دقيقاً جداً على البيانات القديمة بينما يتعلم القليل عن كيفية التعرف فعلياً على السرطان من الصور أو من أوصاف المرضى.
تعليم الحواسيب تجاهل الاختصارات
لمعالجة هذه المشكلة، صمّم الفريق مستويات متعددة من تنقية النص. أولاً أزالت قواعد بسيطة أسماء الأمراض الجلدية الصريحة وكلمتي حميد وخبيث. ثم استخدموا نموذج لغة كبير للقيام بتنقية أكثر دقة. في إعداد واحد، استُبدلت عبارات تشخيصية رئيسية وخطط العلاج بعلامات محايدة حتى يتمكن المؤلفون من قياس مقدار ما تضيفه كل نوع من العبارات إلى الأداء. في الإعداد الأكثر صرامة، احتُفظ فقط بالمعلومات الموضوعية التي يمكن للمريض أن يذكرها بشكل معقول، مثل المدة التي كانت الشامة موجودة أو عادات التعرض للشمس الماضية. هدفت هذه المقاربة إلى تقريب النص مما قد تراه أنظمة موجهة للمريض بدلاً من الاعتماد على أدلة داخلية من المتخصّصين.

ما تعلّمته النماذج فعلاً
عندما اعتمد نموذج الحاسوب على الصور وحدها، قدّم أداءً جيداً، لكن إضافة الملاحظات غير المصفاة حسنته بشكل ملحوظ. ارتفع مقياس الدقة الرئيسي، المساحة تحت منحنى المستقبِل التشغيلي (AUROC)، من 0.909 مع الصور فقط إلى 0.970 مع الصور والملاحظات الخام. حتى عندما أُزيلت كل لغة تشخيصية واضحة، ظل دمج الصور مع النص المصفى بعناية يحقق AUROC يقارب 0.948، أعلى من أي مصدر بمفرده. أظهرت تجارب مع العبارات المعلَّمة أن إجراءات بسيطة مثل «إحالة إلى المستشفى» نقلت تقريباً قدر المعلومات نفسه الذي ينقله وسم سرطان صريح، مؤكدة أن كثيراً من الملاحظات تحمل تحيزاً داخلياً قوياً. كما فحص المؤلفون الأداء عبر فئات العمر ونغمات الجلد ووجدوا مستويات نسبياً منخفضة من عدم الإنصاف، سواءً للنماذج القائمة على الصور فقط أو للنماذج متعددة النمط بالكامل.
ماذا يعني هذا لفحوصات الجلد المستقبلية
بالنسبة لغير المتخصّصين، الخلاصة الأساسية هي أن ملاحظات الأطباء تحتوي على دلائل حقيقية ومفيدة يمكن أن تساعد الحواسيب في دعم قرارات سرطان الجلد، لكنها تحتاج إلى معالجة بعناية. إذا سُمِح للنماذج بقراءة الملاحظات غير المصفاة، فقد تتعلم تقليد صياغة الأطباء بدلاً من التعرف على الشامات الخطرة بنفسها. تُظهر هذه الدراسة أنه من خلال تنظيف النص بعناية ودمجه مع الصور والبيانات الأساسية للمريض، يمكن رفع الدقة مع تقليل التحيز الخفي. مع مرور الوقت، قد تساعد مثل هذه الأدوات متعددة النمط أطباء الرعاية الأولية على إحالات أفضل وتقليل الانتظار للرعاية المتخصّصة، وفي الوقت نفسه تمهّد الطريق لأنظمة آمنة واعية بالنص قد تساعد المرضى مباشرة يوماً ما.
الاستشهاد: Watson, M., Winterbottom, T., Hudson, T. et al. Multimodal models for skin cancer classification using clinical freetext and dermatoscopic images. Commun Med 6, 277 (2026). https://doi.org/10.1038/s43856-026-01456-2
الكلمات المفتاحية: سرطان الجلد, تعلّم الآلة, الأمراض الجلدية, الملاحظات السريرية, التصوير الطبي