Clear Sky Science · ar

طريقة لحماية خصوصية البيانات لنماذج التنبؤ بالأمراض المعدية مع توازن بين سرعة التدريب والدقة

· العودة إلى الفهرس

لماذا لا تزال حماية بيانات الصحة مهمة

تعتمد المستشفيات والوكالات الصحية الآن على الذكاء الاصطناعي للتنبؤ بتفشّيات الإنفلونزا وكوفيد-19 وأمراض معدية أخرى قبل أيام أو أسابيع. يمكن أن توجه هذه التنبؤات حملات التطعيم وتخطيط القوى العاملة والطوارئ. ومع ذلك، فإن سجلات المرضى التفصيلية نفسها التي تجعل التنبؤات دقيقة هي أيضاً حساسة للغاية. كثيراً ما تمنع القوانين والمخاوف العامة جمع البيانات عبر المؤسسات، مما يضعف فعالية هذه النماذج. يقدم هذا البحث طريقة لتدريب أنظمة تنبؤ عالية الجودة للأمراض المعدية مع إبقاء بيانات كل مستشفى محايدة ومؤمّنة في موقعها.

التعلّم من عدة مستشفيات دون مشاركة السجلات

يبني المؤلفون على تقنية تُسمى التعلّم الفيدرالي، حيث تتعاون عدة مستشفيات على تدريب نموذج تنبؤ مشترك. بدلاً من نسخ السجلات الخام لمرضى إلى خادم مركزي، يقوم كل موقع بتدريب النموذج محلياً ويرسل فقط تحديثات رقمية لإعدادات النموذج الداخلية. يجمع خادم مركزي هذه التحديثات ويرسل النموذج المحسّن مرة أخرى. تتكرر هذه الدورة عدة مرات. نظرياً، يحمي التعلّم الفيدرالي الخصوصية لأن المعلومات الشخصية لا تخرج من المبنى. عملياً، مع ذلك، قد يستنتج مهاجمون ذوو حيلة أحياناً تفاصيل عن البيانات الأساسية من التحديثات المشتركة، لذا فإن حماية إضافية تكون ضرورية.

Figure 1
الشكل 1.

تأمين الأرقام بتشفير ذكي

لتقوية الأمان، يستخدم الفريق التشفير المتماثل عملياً—شكل من الأقفال الرقمية التي تسمح بإجراء حسابات مباشرة على أرقام مشفّرة دون رؤيتها بشكل صريح. نظم هذا النوع التقليدية آمنة للغاية لكنها بطيئة ومعتمدة على بيانات كثيرة، مما يجعل استخدامها مع نماذج كبيرة ومعقدة مثل شبكات الذاكرة طويلة النطاق (LSTM) صعباً. يصمم الباحثون مخططاً هجيناً يعامل أجزاء مختلفة من النموذج بطرق مختلفة. تُحمى المكونات الأكثر إفصاحاً بتشفير قوي لكنه ثقيل، بينما تستخدم الأجزاء الأقل حساسية قفلًا أخف وأسرع. بالإضافة إلى ذلك، يقرر جدول عشوائي مخطط مسبقاً في أي جولات تدريبية تُرسل المواقع التحديثات المشفّرة فعلياً، مما يسمح لها بتجاوز الاتصالات المكررة. تُظهر الاختبارات أن هذا المزيج يسرّع التدريب بنحو 25 بالمئة مقارنةً باستخدام التشفير الثقيل في كل مكان، مع الحفاظ على حماية البيانات وفق افتراضات تشفيرية قوية.

إرسال التحديثات المهمة فقط

حتى مع الأقفال الأذكى، فإن نقل كل تعديل طفيف في النموذج ذهاباً وإياباً بين المؤسسات يهدر الوقت وعرض النطاق الشبكي. لذلك يقترح المؤلفون قاعدة تدريب جديدة تُسمى اختيار البيانات–الانحدار العشوائي الموزّع باختيار انتقائي (DS-DSSGD). أثناء التدريب، يقيس الخوارزم مقدار تغيّر كل جزء من النموذج من خطوة إلى أخرى. تُنقل فقط التحديثات التي تتجاوز عتبة محددة مسبقاً؛ بينما تُتجاهل التغييرات الصغيرة قليلة التأثير. في الوقت ذاته، تتعقّب الخوارزمية نقاط البيانات المسؤولة عن أكبر التغيّرات وأكثرها إفادة. تُجمع هذه السجلات المؤثرة في مجموعة بيانات مكرّرة تُستخدم لجولة نهائية من التدريب. أظهرت التجارب على ثلاث سنوات من تقارير العدوى الحقيقية من مدينة ييتشانغ، مقترنة باتجاهات البحث المحلية على الويب، أن DS-DSSGD يخفض زمن التدريب بنحو 10 بالمئة مقارنةً بعدة طرق قياسية، دون أي فقد ذي معنى في دقة التنبؤ.

منصة عملية للتعاون الآمن

التقدّم التقني مهم فقط إذا أمكن للمستشفيات والمختبرات استخدامه فعلياً. لسدّ هذه الفجوة، يدمج الفريق طرقه في بيئة حوسبة حقيقية تُسمى منصة حوسبة أمان خصوصية يي شو فانغ XDP. تدير XDP رحلة بيانات الصحة كاملة، من الجمع والتنظيف إلى التحليل المشفّر ومشاركة النتائج. تدعم أدوات مألوفة يستخدمها الإحصائيون والمعلوماتيون الحيويون والأطباء، وتسمح للباحثين من مؤسسات مختلفة بالتعاون داخل مساحة عمل محكومة دون تنزيل البيانات الخام أبداً. داخل هذه المنصة، يعمل المخطط الهجين للتشفير وخوارزمية DS-DSSGD كمكوّنات قابلة للإضافة، محوّلين الإطار النظري إلى نظام عملي.

Figure 2
الشكل 2.

ما يعنيه هذا لتنبؤات التفشّي المستقبلية

بعبارات مبسطة، تُظهر هذه الدراسة أنه من الممكن «جمع الأمرين معاً» في تنبؤات الأمراض المعدية: حماية خصوصية المرضى مع تدريب نماذج سريعة ودقيقة على بيانات مأخوذة من العديد من المؤسسات. من خلال تشفير أجزاء مختلفة من النموذج بمستوى القوة المناسب، وإرسال التحديثات فقط عند الضرورة، واحتضان كل شيء داخل منصة تعاون آمنة، يخفض المؤلفون تكلفة الخصوصية من عبء مُرهق إلى أعباء قابلة للإدارة. إذا تم تبنّي مثل هذه المناهج على نطاق واسع، فقد تسمح للمستشفيات والوكالات الصحية بتجميع معارفها للتصدّي للوباء التالي دون تعريض سجلات طبية فردية.

الاستشهاد: Wang, X., Jiang, Y., Pan, G. et al. A data privacy protection method for infectious disease prediction models with balanced training speed and accuracy. Sci Rep 16, 7415 (2026). https://doi.org/10.1038/s41598-026-38906-9

الكلمات المفتاحية: التنبؤ بالأمراض المعدية, خصوصية بيانات الصحة, التعلّم الفيدرالي, التشفير المتماثل عملياً, التعلّم العميق