Clear Sky Science · ar
إطار خصوصية تفاضلي تكيفي لنماذج اللغة السريرية مع معايرة ضوضاء واعية للسياق، وميزانية هرمية، وتدقيق في الوقت الحقيقي
لماذا تهم سلامة الذكاء الاصطناعي الطبي
تلجأ المستشفيات إلى الذكاء الاصطناعي لمساعدة الأطباء على صياغة الملاحظات وتلخيص السجلات الطبية الطويلة، لكن كل سطر من النص قد يكشف أمراً شخصياً عميقاً عن المريض. تقدم هذه الورقة PrivLLM-Guard، طريقة لتشغيل نماذج لغة كبيرة على النصوص السريرية بحيث تظل مفيدة للرعاية مع تقليل كبير للاحتمال أن تتسرب تفاصيل خاصة عبر استجابات النموذج.
خصوصية أذكى للنصوص السريرية
نماذج اللغة الحديثة بارعة جداً في قراءة وكتابة الملاحظات الطبية، لكنها قد تحفظ وتكرر أيضاً أجزاء من بيانات التدريب. في الرعاية الصحية، هذا الخطر غير مقبول لأن القوانين والأخلاقيات تتطلب حماية قوية لهويات الأشخاص وتشخيصاتهم وتاريخهم الطبي. تضيف العديد من أدوات الخصوصية الحالية ببساطة نفس مستوى الضوضاء العشوائية في كل مكان داخل النموذج، ما يؤدي غالباً إلى تدهور جودة المخرجات أو إبطاء النظام إلى درجة تمنعه من الاستخدام بجانب المريض. يجادل المؤلفون بأن الذكاء الاصطناعي السريري يحتاج إلى نهج أكثر تفصيلاً يعالج أنواع المعلومات الطبية المختلفة بمستويات حماية متفاوتة.

كيف يعمل الإطار الجديد
يحيط PrivLLM-Guard بنموذج لغة قوي داخل عدة طبقات خصوصية متعاونة. عند الإدخال، يقوم مرمز واعٍ للخصوصية بتعديل التمثيل الداخلي لكل مدخل بشكل طفيف، بحيث لا يمكن تتبع صياغة مريض واحد. عند الإخراج، يتحكم مفكك تشفير مصمم خصيصاً في كيفية توليد النص الجديد، مستخدماً اختيارات مُعشّاة تحد من مدى تقليده لسجل واحد. بين هذين الطرفين، يتتبع النظام مقدار «ميزانية الخصوصية» المنفقة، تماماً مثل عداد، ويوزع تلك الميزانية عبر المكونات بحيث تحصل البنود الأشد حساسية، مثل الأسماء أو التواريخ، على حماية أقوى من الحقائق الطبية العامة مثل أسماء الأدوية الشائعة.
التكيف مع المخاطر في الوقت الحقيقي
ابتكار رئيسي هو أن PrivLLM-Guard لا يعامل كل طلب بنفس الطريقة. يحلل وحدة ضوضاء تكيفية النص الوارد لتقييم مدى خصوصيته: على سبيل المثال، ما إذا كان ملخصاً روتينياً أو حالة نادرة قد تحدد شخصاً واحداً. بناءً على هذا التقييم والسلوك السابق، يضبط النظام مقدار التباين العشوائي الذي يضيفه إلى إشارات النموذج الداخلية. في الوقت نفسه، يراقب رصد خصوصية في الوقت الحقيقي كل رمز (توكين) ينتجه النموذج، مقدراً احتمالية كشفه لأمر حساس. إذا ارتفعت تلك المخاطرة فوق عتبة محددة مسبقاً، يتفاعل النظام فوراً بزيادة الحماية أو حتى بإيقاف الاستجابة، بدلاً من انتظار مراجعة بشرية لاحقة.
الحفاظ على التوازن بين الدقة والسرعة
حماية الخصوصية مفيدة فقط إذا استمرت الملاحظات الناتجة في مساعدة الأطباء. اختبر المؤلفون PrivLLM-Guard على ملايين السجلات المعممة من وحدات العناية المركزة، والرعاية العامة بالمستشفى، ومجموعات بيانات تحدي. تحت إعدادات خصوصية صارمة للغاية، أنتج الإطار ملخصات وتقارير أقرب إلى النصوص المرجعية من عدة نماذج منافسة مُخصصة للحفاظ على الخصوصية، مع الاحتفاظ بالمصطلحات والعلاقات الطبية الهامة. قيم الأطباء الذين راجعوا المخرجات في تخصصات مثل الأورام، وأمراض القلب، وطب الطوارئ، والأشعة النص على أنه دقيق سريرياً وسهل القراءة. كما ظل النظام سريعاً بدرجة كافية للاستخدام في الوقت الحقيقي، مع معالجة أطوال الملاحظات النموذجية في جزء من الثانية وباحتياجات ذاكرة معتدلة.

ما مآل ذلك للمرضى والأطباء
بعبارات بسيطة، يوضح PrivLLM-Guard أن المستشفيات يمكنها استخدام نماذج لغة قوية لتقليل الأعمال الورقية وتوضيح السجلات المعقدة دون الاعتماد على افتراض أن الخصوصية ستعتني بنفسها. من خلال قياس المخاطر باستمرار، وتفصيل الحماية حسب نوع المعلومات، وإثبات ضمانات الخصوصية رياضياً، يوفر الإطار مساراً نحو أدوات ذكاء اصطناعي سريرية تحترم كل من جودة الرعاية وسرية المرضى. ومع بقاء تحديات تتعلق بالأمراض النادرة، واللغات الأخرى، وأنواع البيانات المختلطة مثل الصور، تشير هذه الدراسة إلى أن مساعدين نصيين أكثر أماناً وشفافية في الرعاية الصحية باتوا في المتناول.
الاستشهاد: Alghamdi, A.D. An adaptive differential privacy framework for clinical llms with context-aware noise calibration, hierarchical budgeting, and real-time auditing. Sci Rep 16, 15781 (2026). https://doi.org/10.1038/s41598-026-45883-6
الكلمات المفتاحية: نماذج اللغة السريرية, خصوصية البيانات الطبية, الخصوصية التفاضلية, تلخيص النصوص الصحية, الذكاء الاصطناعي السريري في الوقت الحقيقي