Clear Sky Science · ar
التعلّم الفدرالي لأنظمة السجلات الصحية الإلكترونية المتغايرة مع اختيار المشاركين بتكلفة فعّالة
لماذا مشاركة بيانات المستشفيات صعبة للغاية
تجمع المستشفيات الحديثة كميات هائلة من المعلومات الرقمية عن مرضاها، من نتائج المختبرات والعلامات الحيوية إلى الأدوية والإجراءات. من الناحية النظرية، ينبغي أن يسمح تجميع هذه السجلات عبر مؤسسات عديدة للأطباء ببناء نماذج حاسوبية أكثر ذكاءً تتنبأ بمن هم أكثر عرضة للمخاطر وأي العلاجات قد تفيدهم أكثر. في الممارسة العملية، مع ذلك، تستخدم المستشفيات أنظمة برمجية مختلفة، وتخزن البيانات بصيغ غير متوافقة، ويجب عليها حماية خصوصية المرضى وميزانياتها بشكل صارم. تستكشف هذه الدراسة كيف يمكن للمستشفيات أن تتعلم من بيانات بعضها البعض دون نسخها أو الإنفاق المفرط.
التدريب المشترك دون مشاركة السجلات الخام
يبني المؤلفون على نهج يُسمى التعلّم الفدرالي، حيث تقوم كل مستشفى بتدريب نموذج محلي على سجلات مرضاها ثم تشارك فقط تحديثات النموذج، وليس البيانات الخام. تقوم مستشفى مركزية "مضيفة" بتنسيق هذه العملية وتهدف إلى تحسين نموذج التنبؤ لاحتياجاتها الخاصة، مثل التنبؤ بالمضاعفات في وحدة العناية المركزة. تشارك مستشفيات أخرى، تسمى موضوعات، مقابل تعويض. هذا الإعداد يتجنب نقل السجلات الحساسة بين المؤسسات، لكنه يطرح سؤالين صعبين: كيف نعمل مع العديد من أنظمة السجلات المختلفة، وكيف نتجنب الدفع لشركاء لا يساعدون النموذج فعليًا.

تحويل السجلات المبعثرة إلى لغة مشتركة
تختلف أنظمة السجلات الصحية الإلكترونية اختلافًا واسعًا في كيفية تسمية وترميز المعلومات. قد تخزن مستشفى اختبار سكر الدم تحت رمز رقمي، بينما تستخدم أخرى رمزًا مختلفًا لنفس الاختبار. تحاول الحلول التقليدية تحويل كل شيء إلى قاعدة بيانات معيارية مصممة بعناية، وهو أمر مكلف ويتطلب ساعات عمل خبراء كثيرة. بدلاً من ذلك، يقوم الإطار المقترح، المسمى EHRFL، بتحويل كل حدث طبي إلى قطعة نصية قصيرة. على سبيل المثال، يصبح إدخال مختبري مثل قياس الجلوكوز عبارة مثل "حدث مختبري قيمة الجلوكوز 70 mg/dL." بما أن كل مستشفى تحتفظ بالفعل بقواميس تربط الرموز المحلية بأسماء قابلة للقراءة البشرية، يمكن أتمتة هذا التحويل دون ضبط يدوي مخصص.
بناء ملفات تعريف المرضى من النص
بمجرد كتابة الأحداث كنص، يستخدم EHRFL نماذج معالجة لغة حديثة لتحويل كل حدث إلى متجه عددي، ثم يجمع العديد من الأحداث في "تضمين مريض" واحد — ملخص مضغوط لتاريخ المريض الطبي خلال نافذة زمنية. تغذي هذه التضمينات طبقة تنبؤية تتناول عدة مهام سريرية في آن واحد، مثل التنبؤ بالوفاة بالمستشفى أو الفشل الكلوي بعد دخول العناية المركزة. يجري المؤلفون تدريبًا فدراليًا على خمس مجموعات بيانات حقيقية وكبيرة للعناية الحرجة تمتد عبر مستشفيات وفترات زمنية وأنظمة سجلات مختلفة. عبر مجموعة من الخوارزميات، بما في ذلك طرق فدرالية شائعة الاستخدام، تتفوّق النماذج المدربة بهذا النهج القائم على النص باستمرار على النماذج المدربة على مستشفى واحد فقط، رغم اختلاف صيغ البيانات الأساسية.
اختيار الشركاء المناسبين مع حماية الخصوصية
ليس بالضرورة أن تؤدي زيادة عدد المستشفيات الشريكة إلى نتائج أفضل دائمًا. بعض المؤسسات لها تجمعات مرضى أو أنماط سجلات تختلف كثيرًا عن المضيفة لدرجة أن اندماجها قد يبطئ عملية التدريب أو يضعف الأداء قليلاً، مع إضافة تكلفة. لمعالجة ذلك، يقترح المؤلفون خطوة اختيار مبنية على التشابه بين تضمينات المرضى المتوسطة لكل مستشفى. تقوم المضيفة أولاً بتدريب نموذج على بياناتها الخاصة، وتشارك أوزان النموذج، ويستخدم كل مستشفى مرشح هذه الأوزان لحساب تضمينات المرضى. لحماية الخصوصية، يقوم كل موضوع بقص القيم الشاذة من تضميناته، ومتوسطها إلى متجه واحد، ثم يضيف ضوضاء عشوائية معايرة بعناية قبل إرسال هذا المتوسط المملوء بالضوضاء فقط إلى المضيفة. تقارن المضيفة متوسطها الخاص مع متوسط كل موضوع باستخدام مقاييس تشابه بسيطة وتختار فقط المستشفيات الأكثر تشابهًا للانضمام إلى دورة التدريب الفدرالي الكاملة.

توفير المال دون فقدان الدقة
تُظهر التجارب أن التشابه بين متوسطات تضمينات المرضى للمستشفيات يتماشى مع مدى مساعدة أو إلحاق الضرر بكل مستشفى بأداء التنبؤ للمضيفة. باستخدام هذه الإشارة لاختيار الشركاء، يمكن للمضيفة إسقاط المستشفيات منخفضة التشابه مع الحفاظ على جودة التنبؤ أو حتى تحسينها مقارنة باستخدام كل المواقع المتاحة. كما يوضح المؤلفون نموذج تكلفة يظهر أنه، لأن رسوم استخدام البيانات ووقت التدريب تتناسب مع عدد المستشفيات المشاركة، يمكن أن تؤدي حتى التخفيضات المتواضعة في عدد الشركاء إلى توفيرات كبيرة. وفي الوقت نفسه، خطوة الاختيار خفيفة الوزن: يُدرّب النموذج مرة واحدة، وكل مستشفى يقوم فقط بحسابات بسيطة على متجه متوسط واحد.
ماذا يعني هذا لمستقبل الذكاء الاصطناعي في الرعاية الصحية
للقراء خارج المجال، الرسالة الأساسية هي أنه قد يكون ممكنًا للمستشفيات أن "تتعلّم معًا" دون تجميع سجلات المرضى الخام، وأن تفعل ذلك بطريقة تحترم كلًّا من الخصوصية والقيود المالية. من خلال ترجمة السجلات المتنوعة إلى شكل نصي مشترك ثم استخدام ملخصات تحافظ على الخصوصية لتعدادات المرضى لاختيار شركاء متوافقين، يقدم EHRFL وصفة عملية لبناء أدوات تنبؤية مخصصة للمستشفيات. بينما تركز الدراسة على بيانات العناية المركزة، يمكن أن تمتد نفس الأفكار إلى عيادات المرضى الخارجيين وغرف الطوارئ وحتى المجالات غير الطبية حيث تريد المؤسسات التعاون على نماذج أفضل دون التخلي عن سيطرتها على بياناتها.
الاستشهاد: Kim, J., Kim, J., Hur, K. et al. Federated learning for heterogeneous electronic health record systems with cost effective participant selection. Sci Rep 16, 6876 (2026). https://doi.org/10.1038/s41598-026-38299-9
الكلمات المفتاحية: التعلّم الفدرالي, السجلات الصحية الإلكترونية, خصوصية المرضى, التنبؤ السريري, الذكاء الاصطناعي في الرعاية الصحية