Clear Sky Science · ar
استخدام معالجة اللغة الطبيعية والتعلّم الآلي لتحديد الأمراض المزمنة من سجلات المرضى الإلكترونية في الرعاية الأولية
لماذا ملاحظات طبيبك مهمة أكثر مما تعتقد
عندما تزور طبيب العائلة، يتم تدوين كل سعال وشكوى وقلق في سجلك الطبي الإلكتروني. كثير من هذه التفاصيل موجودة في ملاحظات نصية حرة بدلاً من مربعات اختيار منظمة. تُظهر هذه الدراسة أن تلك الملاحظات السردية، عند دمجها مع تقنيات حاسوبية حديثة، يمكن أن تساعد الأطباء على اكتشاف الأمراض المزمنة مثل التهاب المفاصل، وأمراض الكلى، والسكري، وارتفاع ضغط الدم، ومشاكل التنفس بدقة أكبر — خصوصاً عندما لا تُسجَّل هذه المشكلات بوضوح في أجزاء أخرى من السجل.
دلائل خفية داخل سجلات العيادة اليومية
تحتوي السجلات الطبية الإلكترونية في الرعاية الأولية على نوعين مختلفين من المعلومات. هناك عناصر مهيكلة، مثل رموز الفوترة، وقوائم الأدوية، ونتائج المختبرات، وهناك ملاحظات غير مهيكلة يصف فيها الممارسون الأعراض والتاريخ والتفكير الطبي بلغة عادية. في كندا، غالباً ما تكون رموز الفوترة ناقصة وتُستخدم أساساً لأغراض الدفع بدلاً من التشخيص الدقيق، لذلك تظهر العديد من المشكلات الصحية بوضوح أكبر في الملاحظات مقارنة بمربعات الاختيار. سعى الباحثون لمعرفة ما إذا كان استخراج كلا النوعين من المعلومات معاً يمكن أن يحدد بشكل أفضل خمس حالات طويلة الأمد شائعة لدى مرضى تبلغ أعمارهم 60 عاماً فأكثر والذين راجعوا عيادة طب الأسرة في ألبرتا واحدة.

تعليم الحواسب قراءة لغة الأطباء
لاستخراج الفائدة من النصوص الغنية ولكن الفوضوية في الملاحظات السريرية، استخدم الفريق معالجة اللغة الطبيعية، وهي مجموعة أدوات تساعد الحواسب على التعامل مع اللغة البشرية. قاموا بتنقية الملاحظات عن طريق إزالة الرموز العشوائية، وتوحيد الكلمات، وتوسيع الاختصارات، وتقليل الكلمات ذات الصلة إلى جذور مشتركة. كما بنوا قواعد بسيطة للتعرّف على الحالات التي يفيد فيها النص بأن المريض لا يعاني من حالة ما — على سبيل المثال عبارات مثل "لا دليل على" أو "تم استبعاده" — حتى لا يفسّر الحاسوب هذه العبارات خطأً على أنها حالات إيجابية. أعدّ الأطباء المشاركون قوائم من المصطلحات والعبارات ذات المغزى لكل حالة، مما ساعد الخوارزميات على التركيز على الأفكار الطبية ذات الصلة بدلاً من كل كلمة عارضة.
اكتشاف الموضوعات والتعلّم من الأنماط
بعد ذلك، قام الباحثون بكمّ النص بحيث يمكن إدخاله في نماذج التعلّم الآلي. احتسبوا عدد مرات ظهور كل كلمة أو زوج كلمات في ملاحظات كل مريض، لكنهم أيضاً قلّلوا وزن الكلمات الشائعة جداً وأبرزوا تلك التي كانت مميزة بشكل خاص لحالة معينة. باستخدام طريقة تُسمى نمذجة الموضوعات، تحققوا أن مجموعات الكلمات الأكثر تكراراً في الملاحظات تتوافق مع الحالات ذات الاهتمام — على سبيل المثال مصطلحات مرتبطة بالسكري أو ارتفاع ضغط الدم. خَدَمَت هذه الخطوة كاختبار واقعي، مؤكدة أن الموضوعات التي حددها الحاسوب تتطابق مع المعرفة السريرية قبل بناء نماذج التنبؤ.
ترك الخوارزميات تميّز من المرجّح أن يكون مريضاً
جوهر الدراسة كان تدريب ثلاثة أنواع من نماذج التعلّم الآلي لتقرير ما إذا كان من المرجّح أن يكون كل مريض مصاباً بأي من الحالات الخمس المزمنة. عمل أحد النماذج كحاسبة مخاطر مكررة، وآخر رسم حد فاصل بين الحالات السليمة والمريضة، والثالث شبّه بشبكة بسيطة مستوحاة من الدماغ. درّب الباحثون هذه النماذج أولاً باستخدام الأجزاء المهيكلة من السجل فقط، ثم أعادوا تدريبها باستخدام كل من البيانات المهيكلة وميزات النص المعالجة من الملاحظات. كما قاموا بتعديل المسألة لحقيقة أن بعض الأمراض كانت أقل شيوعاً في العينة عبر إعادة موازنة البيانات بعناية حتى لا تتجاهل الخوارزميات الحالات النادرة.
مكاسب واضحة من استخدام القصة كاملة
عند إضافة الملاحظات غير المهيكلة، أصبحت النماذج أفضل بشكل ملحوظ في التمييز بين من لديه الحالة ومن لا يملكها، خصوصاً للمشكلات التي غالباً ما تُسجّل بشكل ناقص في بيانات الفوترة. تحسنت مقاييس قدرة النماذج على فصل المرضى الأصحاء عن المرضى المرضى ودرجة موثوقيتها في الإبلاغ عن الحالات الحقيقية بشكل لافت لكل من التهاب المفاصل وأمراض الجهاز التنفسي. على سبيل المثال، تحسّن الأداء في كشف مشاكل التنفس والتهاب المفاصل من مستوى مقبول إلى قوي عند تضمين الملاحظات. كانت المكاسب في حالة السكري وارتفاع ضغط الدم أقل لأن هذه الحالات كانت مُلتقطة جيداً بالفعل في الحقول المهيكلة. ومن المثير للاهتمام أن النماذج الأبسط غالباً ما أظهرت أداءً مساوياً، أو أفضل من، الشبكة العصبية الأكثر تعقيداً، مما يشير إلى أن التعلم العميق المتقدم ليس ضرورياً دائماً لمثل هذا العمل على مستوى العيادة.

ماذا يعني هذا لرعايتك المستقبلية
بشكل عام، تُظهر الدراسة أن الانتباه للأجزاء السردية من السجلات الطبية — وليس فقط الرموز وأرقام المختبر — يمكن أن يحسّن بشكل كبير قدرتنا على اكتشاف المرضى المصابين بأمراض مزمنة. من خلال تحويل الملاحظات النصية الحرة إلى إشارات قابلة للقراءة آلياً ودمجها مع البيانات المهيكلة الموجودة، قد تتمكن أنظمة الرعاية الصحية من تحديد المرضى المعرضين للخطر مبكراً، وتركيز المتابعة حيث الحاجة أكبر، وتوسيع هذا النهج ليشمل حالات أخرى تظهر غالباً في قصة الزيارة المكتوبة بدلاً من قوائم الاختيار المنسدلة.
الاستشهاد: Zhang, N., Abbasi, M., Khera, S. et al. Leveraging natural language processing and machine learning to identify chronic conditions from primary care electronic medical records. Sci Rep 16, 8441 (2026). https://doi.org/10.1038/s41598-026-38594-5
الكلمات المفتاحية: السجلات الطبية الإلكترونية, كشف الأمراض المزمنة, معالجة اللغة الطبيعية, التعلّم الآلي في الرعاية الصحية, بيانات الرعاية الأولية