Clear Sky Science · ar
إطار خصوصية مضمن بعملية بواسون العشوائية للتعلم الفيدرالي مع تشفير متناظر آمن في الذكاء الاصطناعي الطبي
حماية الأسرار الطبية أثناء تعليم الآلات
تجمع المستشفيات أعدادًا هائلة من صور الأشعة السينية التي يمكن أن تساعد الأطباء في اكتشاف أمراض مثل كوفيد‑19 مبكرًا وبمزيد من الدقة. لكن هذه الصور شخصية للغاية، والقوانين الصارمة لحماية الخصوصية تجعل من الصعب تجميع البيانات في مكان واحد لتدريب أدوات ذكاء اصطناعي قوية. تُظهر هذه الدراسة طريقة تسمح للمستشفيات بالتعاون على نظام تشخيص بالأشعة السينية مشترك دون تسليم صورها الخام لأي طرف آخر، بهدف إبقاء بيانات المرضى محمية مع الحفاظ على دقة عالية.

لماذا مشاركة البيانات الطبية صعبة للغاية
تعتمد تقنيات الذكاء الاصطناعي الحديثة على مجموعات بيانات كبيرة ومتنوعة، لكن المستشفيات عادةً ما تحتفظ بالصور محليًا وتتردد—أو لا يمكنها قانونًا—إرسالها إلى خادم مركزي. الأساليب التقليدية التي تنسخ كل البيانات إلى قاعدة بيانات كبيرة واحدة تعرضها لخطر التسريبات والهجمات الإلكترونية، مما يقوض ثقة الجمهور وينتهك الأنظمة التنظيمية. وحتى الأساليب الأحدث، حيث تتعاون المستشفيات على تدريب نموذج مشترك في نهج يُعرف بـ "التعلم الفيدرالي"، ليست آمنة تمامًا: يمكن للمهاجمين الماهرين في بعض الأحيان عكس تحديثات النموذج لاستنتاج شكل صور المرضى. وفي الوقت نفسه، غالبًا ما تكون البيانات الطبية غير متوازنة وفوضوية، حيث تمتلك بعض المستشفيات حالات أكثر لحالة مرضية معينة من غيرها، ما قد يزعزع التدريب ويقلل الاعتمادية.
شبكة تعاونية لا تشارك الأشعة السينية الخام أبدًا
يصمم المؤلفون إطار تعلم فيدرالي يدور حول نموذج قوي للتعرف على الصور معروف باسم ResNet‑50 لتمييز كوفيد‑19 عن صور الأشعة السينية الصدرية الطبيعية. كل مستشفى يدرب نسخته المحلية من هذا النموذج على صوره المحلية، مع إبقاء كل الأشعة السينية في مكانها. بدلاً من إرسال الصور، ترسل المستشفيات فقط تحديثات رقمية تصف كيفية تغيير نموذجها المحلي. يقوم خادم مركزي بتجميع هذه التحديثات لحساب نموذج عالمي محسن ثم يعيد النموذج المحسّن إلى كل مستشفى. يتيح تكرار هذه الدورة أن يستفيد النموذج المشترك من خبرات جميع المشاركين دون الكشف عن فحوصات فردية.
إضافة "ضجيج" رقمي وصناديق أمان لخصوصية إضافية
لإحباط محاولات المهاجمين لإعادة بناء صور المرضى من تحديثات النموذج، يطبّق الإطار طبقتين من تقنيات الخصوصية فوق التعلم الفيدرالي. أولاً، تضيف كل مستشفى ضجيجًا عشوائيًا مضبوطًا بعناية إلى تحديثاتها، أشبه بإضافة تداخل إلى إشارة راديو بحيث يصعب استخراج الأصوات الفردية بينما يظل المضمون العام مرئيًا. ثانيًا، قبل أن تنتقل التحديثات عبر الشبكة، تُشفّر بطريقة تسمح للخادم بجمعها بينما تظل مغلقة—مماثل لجمع قيم موضوعة داخل مظروف مختوم. لا يمكن لفتح النتيجة المجمعة إلا لجهة تحمل المفتاح الموثوق، ولا يرى الخادم المركزي أي تحديث مستشفى بشكل صريح. معًا، تهدف هذه الخطوات إلى إعاقة محاولات عكس بيانات المرضى مع الحفاظ على فعالية النموذج المشترك.

اختبار النظام عمليًا
يقيم الفريق إطاره على مجموعة متزنة من صور الأشعة السينية الصدرية لكوفيد‑19 والطبيعية، مع محاكاة عدة مستشفيات كمواقع تدريب منفصلة. يقارنون بين ثلاث إعدادات: التدريب المركزي الكلاسيكي مع تجميع كل البيانات، والتعلم الفيدرالي القياسي بدون حماية إضافية، ونهجهم المحسّن للخصوصية. على الرغم من الضجيج والتشفير المضافين، يحقق النظام المحمي نتائج عالية بشكل لافت—حوالي دقة 99.6%، مع مقاييس دقة، استدعاء، وF1 قوية بالمثل—منافسًا أو متفوقًا على نسختي التجميع والمشاركة غير المحمية. تُظهر قياسات جولات الاتصال، وخسارة التدريب، ووقت الحساب أن الدقة تتحسن بثبات مع تعاون المواقع، بينما يظل تكلف الزمن الإضافي الناتج عن التشفير متواضعًا. تجارب الإقصاء التي تطفئ وتُشغّل عناصر من النظام تؤكد أن مستويات الضجيج المختارة واستراتيجية التشفير مع الضغط توفر خصوصية قوية مع مقايضات أداء طفيفة.
ما يعنيه هذا للرعاية المستقبلية
لغير المتخصصين، الرسالة الأساسية هي أن هذا العمل يقدم وصفة عملية لتدريب الذكاء الاصطناعي من صور الأشعة السينية لعدة مستشفيات دون كشف الصور الخام أو التهاون في قوانين الخصوصية. بدمج نموذج صور عالي الأداء مع "ضجيج" رقمي وتجميع مشفّر، يظهر الإطار أن بإمكان المستشفيات بناء أدوات تشخيص دقيقة بشكل مشترك مع إبقاء سجلات المرضى محليًا وخارج متناول المتطفلين. وعلى الرغم من اختباره على مجموعة بيانات نسبياً صغيرة وتركيزه على أشعة كوفيد‑19، يمكن أن تمتد نفس الأفكار إلى أمراض أخرى وأنواع تصوير أخرى، وحتى إلى مجالات حساسة أخرى مثل المالية. باختصار، تشير الدراسة إلى مستقبل يمكن فيه للذكاء الاصطناعي القوي والخصوصية الطبية الصارمة أن يدعما بعضهما بدل أن يتعارضا.
الاستشهاد: Gomathi, R., Saranya, K., Mahaboob John, Y.M. et al. Stochastic Poisson-embedded privacy framework for federated learning with secure homomorphic encryption in medical AI. Sci Rep 16, 10931 (2026). https://doi.org/10.1038/s41598-026-41469-4
الكلمات المفتاحية: التعلم الفيدرالي, التصوير الطبي, خصوصية البيانات, التشفير الشبيه بالتحويليات (homomorphic encryption), تشخيص بالأشعة السينية