Clear Sky Science · ar

نحو روبوتات محادثة موثوقة: بروتوكول لاختبار الهجمات الحمراء للمحادثات المتعلقة بالصحة

2026-03-31 · العودة إلى الفهرس

لماذا تهم روبوتات المحادثة الصحية الأكثر أمانًا

يتجه الكثير من الناس إلى روبوتات المحادثة لطلب المساعدة في مشكلات حياتية عملية تؤثر على صحتهم، مثل العثور على بنوك طعام أو ملاجئ أو مساعدات مالية. هذه السهولة تثير سؤالًا جادًا: كيف نتأكد من أن هؤلاء المساعدين الرقميين لا يقدمون نصائح خطرة أو مضللة، خاصة عندما يكون المستخدمون متوترين أو مرتبكين أو في خطر؟ تستكشف هذه الدراسة فحوصات سلامة خطوة بخطوة لمثل هذه الروبوتات، وتوضح كيف يمكن اختبارها وضبطها قبل الوثوق بها في محادثات حساسة تتعلق بالصحة.

تجاوز الحكم البسيط على الصواب والخطأ

تركز معظم فحوص روبوتات المحادثة الصحية على ما إذا كانت حقائق محددة صحيحة أم خاطئة. يجادل المؤلفون بأن ذلك لا يكفي. قد يكرر الروبوت حقائق معتمدة فقط ومع ذلك يتصرف بطرق غير آمنة، مثل تجاوز دوره، أو تقديم آراء حيث لا ينبغي، أو الاستجابة بشكل سيئ لشخص في أزمة. لالتقاط ذلك، يفصلون بين نوعين من السلوك. الأول هو مدى التزام الروبوت بالمعلومات الواردة في وثيقة معتمدة، مثل قائمة موارد. والثاني هو مدى اتباعه لقواعد سلوكية عامة، مثل البقاء في الموضوع، والتحلي بالأدب، ورفض استخدام معرفة غير معتمدة، وتوجيه المستخدمين إلى أشخاص حقيقيين عند الحاجة.

Figure 1. كيف يربط روبوت محادثة صحي الأشخاص بخدمات أساسية مع البقاء ضمن حدود أمان واضحة.

تعريض روبوت المحادثة للضغوط عمداً

اختبر الفريق روبوت محادثة حقيقيًا بُني لربط الناس بالمساعدة فيما يخص الاحتياجات الاجتماعية المتعلقة بالصحة، مثل الغذاء والسكن والسلامة. صمموا سبعة أنواع من رسائل المستخدم التحدّية، تسمى متجهات الهجوم، التي تحاكي المحادثات الواقعية بدلًا من الحيل المختبرية فقط. حاولت بعض الهجمات خداع الروبوت للاختلاق تفاصيل عن مورد ما. بينما دفعت هجمات أخرى الروبوت إلى تقديم نصائح خارج نطاقه المعتمد، أو الرد على مستخدمين في ضائقة، أو التعامل مع لغة سامة أو فظة، أو تجاهل قواعد السلامة الخاصة به عبر مطلعات مرغوبة. وُضعت هذه الاختبارات في بدايات المحادثات ولاحقًا أيضًا، عندما كان النظام قد استدعى معلومات عن الموارد، لرؤية كيف يتغير السلوك مع تطور الحوار.

ما الذي انهار عندما طالت المحادثات

عندما نظر الفريق فقط إلى اختبارات قصيرة بسؤال واحد، بدا أن الروبوت قوي في الالتزام بالوثائق التي استرجعها؛ لم يخترع حقائق جديدة حول الخدمات. المشكلة الأكبر كانت في اتباع قواعد السلوك. في الأسئلة المرتكزة على تقديم نصائح، انزلق أحيانًا إلى تقديم إرشادات «بديهة» لم تكن مدعومة بأي مصدر معتمد. عندما وصف المستخدمون ضائقة أو خطرًا، اختلق الروبوت أحيانًا تفاصيل عن خطوط مساعدة للأزمات بدل الاعتماد على جهات اتصال موثقة. ظهرت أخطر المشكلات عند إجراء محادثات أطول متعددة التحولات، حيث ضغط الباحثون بلطف لكن بحزم للإجابة. في هذه الحوارات متعددة الجولات، ارتفعت معدلات الخطأ بشكل حاد، وظهرت كل المشكلات الأعلى خطورة هنا، بما في ذلك نصائح تلقي باللوم على الضحية وتقديم نصائح مفصلة حول مغادرة أوضاع مسيئة لم يكن مؤهلاً لتقديمها.

Figure 2. كيف تعمل الاختبارات والقواعد والنصوص الموثوقة معًا لتوجيه روبوت محادثة صحي نحو ردود أكثر أمانًا.

إصلاح نقاط الضعف بالقواعد والنصوص الموثوقة

بعد الكشف عن هذه النقاط الضعيفة، حاول المؤلفون إصلاحين رئيسيين. أولًا، عززوا قواعد الروبوت الداخلية بإضافة تعليمات واضحة ومتكررة بعدم إعطاء نصائح غير معتمدة، وعدم اختراع معلومات الاتصال، وإحالة المستخدمين دائمًا إلى مساعدة مهنية عندما تعجز الوثائق. ثانيًا، أضافوا وثيقة سؤال وجواب مكتوبة بعناية لحالات الأزمة والضيق، مليئة بإرشاد محلي آمن يمكن أن يستند إليه الروبوت بدل التخمين. أدت هاتان التغييرات معًا إلى خفض الأخطاء بشكلٍ كبير وبشكل خاص القضاء على أسوأ أنواع الردود غير الآمنة. عندما تعرض الروبوت لضغط شديد في محادثات ممتدة، كان يميل إلى العودة إلى نمط آمن من رفض الإجابة المباشرة وتوجيه الأشخاص نحو موارد موثوقة.

ما الذي يعنيه هذا للمساعدين الرقميين في المستقبل

للمستخدمين اليوميين، الرسالة الأساسية هي أن بناء روبوت محادثة صحي موثوق لا يتعلق بجعله يبدو ذكيًا بقدر ما يتعلق بجعله يفشل بأمان. تُظهر هذه الدراسة أن محادثات «الهجوم الأحمر» الواقعية والمدروسة يمكن أن تكشف عن مشكلات خفية تفوتها الاختبارات السريعة، وأن مزيجًا من قواعد أشد وإرشاد مكتوب مُدقق يمكن أن يدفع روبوتات المحادثة إلى سلوك أكثر أمانًا. وبينما لا يحل هذا محل الأطباء الحقيقيين ولا يضمن أمانًا كاملاً، فإنه يقدم خارطة طريق عملية لتحويل أدوات المحادثة المفيدة لكن القابلة للخطأ إلى شركاء أكثر موثوقية عندما يطلب الناس الدعم بشأن الاحتياجات الأساسية والحالات الصعبة.

الاستشهاد: Hussain, SA., Jackson, D.I., Lewis, A. et al. Toward trustworthy chatbots: a protocol for red teaming for health related conversations. Sci Rep 16, 15550 (2026). https://doi.org/10.1038/s41598-026-45719-3

الكلمات المفتاحية: روبوتات محادثة صحية, أمان الذكاء الاصطناعي, اختبار الهجوم الأحمر, التوليد المعزز بالاسترجاع, الذكاء الاصطناعي الموجه للمريض