Clear Sky Science · ar
دمج الوعي بالإنصاف في نماذج معالجة اللغة السريرية
لماذا يهم هذا في الرعاية الصحية الواقعية
تعتمد الطب الحديث بشكل متزايد على الذكاء الاصطناعي المبني من سجلات صحية إلكترونية. ومع ذلك، فإن حقيقة أساسية عن المرضى — مثل عرقهم أو إثنيتهم — غالباً ما تكون مفقودة أو مسجلة بشكل غير متسق. هذه الفجوة تجعل من الأصعب كشف ومعالجة عدم المساواة الصحية. تستقصي هذه الورقة ما إذا كان بالإمكان للحواسيب استرداد معلومات العرق من ملاحظات الأطباء بشكل موثوق مع تجنب معاملة المجموعات بشكل غير عادل، وما الذي تكشفه هذه العملية عن التحيز في كل من السجلات الطبية وأدوات الذكاء الاصطناعي.

ثغرات خفية في السجلات الطبية
تترك العديد من المستشفيات والعيادات حقول العرق والإثنية فارغة أو تستخدم تصنيفات قديمة. هذه الإدخالات المفقودة ليست مجرد أخطاء كتابية؛ بل يمكن أن تشوه الإحصاءات حول من يمرض، ومن يتلقى أي رعاية، ومن يستفيد من العلاجات الجديدة. في المقابل، فإن الأجزاء النصية الحرة من السجلات — مثل السجل الاجتماعي وملاحظات عوامل الخطر — كثيراً ما تذكر خلفية المريض بشكل عابر. تساءل المؤلفون عما إذا كان يمكن تحويل تلك الإشارات المتناثرة في النص غير المنظم إلى سجل منظم ومتسق عن العرق، مما يوفر صورة أوضح عن عدم المساواة في الصحة واستخدام الرعاية الصحية.
تعليم الحواسيب قراءة ملاحظات الأطباء
عمل الفريق مع قاعدة بيانات رعاية أولية كندية كبيرة تحتوي على سجلات نحو 400,000 مريض ومن أكثر من 400 عيادة. من هذه البيانات اختاروا عينة ممثلة تقارب 4,000 مريض بالغ وقاموا بعناية بتوسيم الجمل التي تشير بوضوح إلى العرق أو الإثنية، مستخدمين تسع فئات مثل: أسود، شرق آسيوي، لاتيني أمريكي، وسكان أصلانيون، بالإضافة إلى فئة «غير مذكور» عندما لا يظهر أي ذكر. وبما أن معظم الملاحظات لا تذكر العرق أبداً، استخدموا استراتيجية «التعلم النشط» حيث تشير نموذج أولي للذكاء الاصطناعي إلى الملاحظات التي كان الأكثر عدم يقين بشأنها، ليركز المعلِّقون البشر على الحالات التي يحتمل أن تحتوي معلومات عن العرق.

بناء نماذج لغوية أكثر عدلاً
قارن الباحثون عدة نماذج لغوية شائعة مبنية على المحولات — مثل BERT ونُسخها السريرية — مع شبكة عصبية تلافيفية هرمية مصممة خصيصاً. على عكس النماذج القياسية التي تعامل الملاحظة كسلسلة طويلة من الكلمات، تحاكي النموذج الهرمي طريقة كتابة الأطباء: يعالج الكلمات داخل الجمل ثم الجمل داخل الملاحظة ثم ملاحظات المريض عبر الزمن. كما جرب الفريق تدريباً «واعي الإنصاف»، أضافوا فيه مصطلحات إلى دالة الخسارة تعاقب الفروق الكبيرة في معدلات الخطأ بين المجموعات العرقية وعدلوا مقدار «أهمية» الأخطاء للمجموعات الممثلة تمثيلاً ناقصاً.
ما الذي نجح وما الذي لم ينجح
تفوق النموذج الهرمي على جميع نماذج المحولات إجمالاً، محققاً دقة عالية وأداء أكثر توازناً عبر الفئات العرقية، حتى قبل تعديلات الإنصاف. على النقيض من ذلك، أدت عدة محولات أداء جيداً للمرضى البيض لكنها فوتت كثيراً من الحالات بين المجموعات الأصغر، أحياناً متنبئة فقط بالفئة الأكثرية. ساعدت قيود الإنصاف بعض النماذج بشكل كبير، خاصة BERT، مما جعل توقعاتها أكثر دقة وتوزيعها أكثر توازناً بين المجموعات. لكن نفس القيود أضرت بنماذج أخرى، بما في ذلك النموذج الهرمي، وفي أحد المحولات السريرية تسببت في تراجع النظام مرة أخرى نحو تنبؤات الأغلبية. كما وجدت الدراسة اختلافات مستمرة عبر تقاطعات العرق والجنس والعمر، حيث ظلت مجموعات السكان الأصليين، وأصحاب الأصول المختلطة، وبعض الفئات الآسيوية واللاتينية الأمريكية الأصعب في التصنيف.
ما تكشفه هذه النتائج عن التحيز
بما أن النموذج الأفضل أداءً تمكن من اكتشاف معلومات العرق بشكل موثوق عندما كانت موجودة، يرى المؤلفون أن المشكلة الرئيسية ليست نقص الإشارة في الملاحظات بل كيفية تفاعل النماذج ومجموعات البيانات مع أوجه عدم المساواة الهيكلية الطويلة الأمد. تسلل التحيز عبر التمثيل الناقص لبعض المجموعات، ومن خلال أنماط كيفية وصف الأطباء لمرضى مختلفين، وحتى عبر عملية التعلم النشط التي اختارت أي ملاحظات تُوسم. خفّض التدريب الواعي بالإنصاف بعض الفوارق لكنه لم يستطع تجاوز هذه المشكلات الأصلية تماماً، وكانت تأثيراته معتمدة بشدة على تصميم النموذج.
الرسالة الأساسية للمرضى والسريريين
تظهر هذه الدراسة أنه من الناحية التقنية من الممكن بناء نماذج لغوية تستعيد معلومات العرق من النص السريري بدقة عالية وبمزيد من العدالة، لا سيما عندما تحترم البنى المعمارية الهيكل الطبقي لملاحظات المرضى. ومع ذلك، توضح أيضاً أن الخوارزميات وحدها لا تستطيع إصلاح عدم المساواة الناشئة من ممارسات التوثيق ونظام الرعاية الصحية نفسه. لكي يدعم الذكاء الاصطناعي رعاية أكثر عدلاً، يجب أن يُبنى الإنصاف في كل مرحلة — من كيفية جمع البيانات وعينتها إلى كيفية تدريب النماذج ومراجعتها واستخدامها — بينما تعمل المؤسسات الصحية على تحسين طريقة تسجيلها واستخدامها للمعلومات الاجتماعية والديموغرافية.
الاستشهاد: Abulibdeh, R., Lin, Y., Ahmadi, S. et al. Integration of fairness-awareness into clinical language processing models. Commun Med 6, 178 (2026). https://doi.org/10.1038/s43856-026-01433-9
الكلمات المفتاحية: المعالجة الطبيعية للغة السريرية, الإنصاف الخوارزمي, السجلات الصحية الإلكترونية, عدالة صحية, بيانات العرق والإثنية