Clear Sky Science · ar
مساعد ذكاء اصطناعي متكيّف مع السلوك يعزّز إمكانية الوصول وسهولة الاستخدام للمكفوفين عبر تخصيص التفاعل في الوقت الفعلي
لماذا الأصوات الأذكى مهمة
أصبحت الحواسيب الناطقة شائعة في هواتفنا ومكبرات الصوت وأجهزة الكمبيوتر المحمولة. لكن بالنسبة للأشخاص الذين لا يبصرون، هذه الأصوات ليست مجرد وسيلة راحة — بل هي شريان حياة للمعلومات والعمل والمهام اليومية. تعرض هذه الورقة AURA، نوعًا جديدًا من المساعدات الناطقة المصممة للاستماع ليس فقط لما يقوله المستخدمون المكفوفون، بل لكيفية تفاعلهم في الوقت الفعلي، مع تعديل لطيف في أسلوب الكلام بحيث يصبح أسهل للمتابعة وأقل إجهادًا.
أدوات يومية لا تزال تقصّر
قارئو الشاشة والمساعدات الصوتية اليوم تقرأ الشاشات أو تجيب عن الأسئلة، لكنها عادة ما تتحدث مع الجميع بنفس الطريقة. تميل إلى التحدث بسرعة ثابتة، وتقدّم إما تفاصيل كثيرة جدًا أو قليلة جدًا، وتعرض المحتوى بترتيب صارم. بالنسبة لكثير من المستخدمين المكفوفين، تؤدي هذه المقاربة «مقاس واحد يناسب الجميع» إلى إعادة تشغيل متكررة، وتخطي كثير، وإرهاق ذهني أثناء محاولتهم المتابعة أو استخراج ما يهمهم. أظهرت أبحاث سابقة أن تغيير سرعة الكلام، وكمية التفاصيل، وتعقيد اللغة يمكن أن يحدث فرقًا كبيرًا، ومع ذلك فإن معظم الأدوات لا تتكيف تلقائيًا أثناء تطور المحادثة.
نوع جديد من الاستماع
تم تصميم AURA (المساعد المتكيّف المستجيب للمستخدم) لتغيير هذا النمط. إنه نظام صوتي يدمج نموذجًا لغويًا قويًا — نفس التكنولوجيا العامة وراء الدردشات المتقدمة — مع طريقة بسيطة وذكية لمراقبة كيف يتصرف المستخدم أثناء الجلسة. بدلاً من التخمين اعتمادًا على استبيانات طويلة أو ملفات تعريف ثابتة، تراقب AURA ثلاث إشارات طبيعية: عدد مرات إعادة تشغيل المستخدم للرد، عدد مرات مقاطعة الرسالة، ومدة استماعه قبل أن يتخذ إجراءً. هذه الدلائل لا تحتاج إلى أجهزة إضافية، ولا تكشف بيانات خاصة مثل حركة العين أو معدل ضربات القلب، وتندمج بشكل طبيعي في طريقة استخدام الناس لأنظمة النطق بالفعل.

كيف يتكيف المساعد أثناء الحديث
تعمل التفاعلات داخل AURA في حلقة مغلقة. أولًا يتحدث المستخدم، وتتحول كلماته إلى نص. ثم يجلب النظام ملف تعريف خفيفًا يخزن ثلاث دواير قابلة للتعديل: مدى سرعة النطق، وطول إجاباتها، ومدى بساطة أو تعقيد اللغة. يشكل هذا الملف المطالبة المُرسَلة إلى النموذج اللغوي، والذي يصيغ بعد ذلك ردًا يهدف بالفعل لمضاهاة أسلوب المستخدم الحالي. يتحول النص إلى كلام باستخدام الإعدادات المختارة ويُعاد تشغيله للمستخدم. أثناء هذا الرد وبعده، تسجل AURA بهدوء ما إذا أعاد المستخدم التشغيل أو تخطّى أو استمع حتى النهاية، ثم تعدّل الملف للجولة التالية. خلال عدد قليل من التبادلات يتمكن المساعد من «التمركز» على أسلوب كلام يناسب المستمع بشكل أفضل — وكل ذلك دون حاجة المستخدم لتغيير قوائم الإعدادات.

اختبار الفكرة في بيئة آمنة
للاطلاع على ما إذا كانت هذه التكيّفات القائمة على قواعد تصرف بشكل معقول، لم يبدأ الباحث بتطوعيين بشريين. بدلاً من ذلك، استخدمت الدراسة ملفات تعريف مستخدمين مُحاكاة تحاكي ثلاثة أنماط شائعة: نمط يعيد التشغيل كثيرًا لأنه يواجه صعوبة في التقاط التفاصيل، ونمط يتخطى كثيرًا لأن الإجابات تبدو طويلة، ونمط يفضّل ردودًا سريعة وكثيفة. لكل ملف تم تشغيل النظام في الكثير من الجلسات القصيرة مع التكيّف وبدونه. ثم قيس معدّل إعادة التشغيل والتخطي، ومدة إنجاز المهام، وما إذا كانت إعدادات المساعد الداخلية تستقر في نمط ثابت يطابق الملف المستهدف. بينما لم تُجر إحصائيات رسمية — إذ كانت هذه محاولة للتحقق من الجدارة لا تجربة مستخدم كاملة — أظهرت الأرقام تحولات واضحة.
ما تشير إليه الأرقام المبكرة
في ظروف الإعادة المتكررة، قلّلت نسخة AURA المتكيّفة من حوادث الإعادة بحوالي ثلثي ما كانت عليه مقارنةً بإعداد ثابت وغير متكيّف. وفي ظروف التخطي الكثيف، انخفضت حالات التخطي بنحو النصف بمجرد أن تعلّم النظام إبقاء الإجابات أقصر وأكثر دقة. عبر جميع الملفات المحاكاة، وصلت إعدادات المساعد إلى حالات مستقرة تطابقت مع النمط المستهدف في معظم الجلسات، واستغرق إكمال مهمة متعددة الخطوات معيارية نحو خمس أقل من الوقت مع تفعيل التكيّف. ومن المهم أن قواعد التكيّف كانت بسيطة وشفافة: الإعادات المتكررة دفعت المساعد نحو بطء أكبر في الكلام ولغة أبسط، بينما دفعت المقاطعات المتكررة نحو ردود أوجز وأكثر كثافة. هذا التصميم يجعل النظام أسهل في الفهم وتصحيح الأخطاء من نموذج تعلمي علبة سوداء — وهو أمر أساسي للسلامة والثقة في تكنولوجيا المساعدة.
ماذا يعني هذا للناس الفعليين
للقراء خارج عالم البحث، الخلاصة الأساسية هي أن الحواسيب الناطقة يمكن أن تصبح مستمعين أكثر مراعاة. من خلال الانتباه إلى إشارات طبيعية مثل «هل أعِدتَ تشغيل ذلك؟» أو «هل قَطعْتَ كلامي؟»، يمكن للمساعد أن يتعلم بسرعة أن يتحدث بطريقة أقل إحباطًا وأكثر كفاءة، خاصة للمكفوفين وضعاف البصر الذين يعتمدون على الصوت. العمل الحالي لم يثبت بعد تحسين التجربة اليومية، لأنه اختُبر بسلوك مولّد حاسوبيًا بدلًا من أشخاص حقيقيين. لكنه يؤسس الأساس — على الصعيدين التقني والمفاهيمي — لدراسات مستقبلية مع مستخدمين مكفوفين، ومحادثات أغنى، ودعم لعدة لغات. إذا نجحت هذه الخطوات المقبلة، يمكن لأدوات مثل AURA أن تساعد في نقل تكنولوجيا المساعدة من آلات قراءة جامدة أحادية الاتجاه إلى شركاء متجاوبين يتكيّفون في الوقت الفعلي مع الأشخاص الذين يعتمدون عليها أكثر.
الاستشهاد: Algamdi, S.A. A behaviour-adaptive AI assistant enhancing accessibility and usability for blind users through real-time interaction personalization. Sci Rep 16, 12666 (2026). https://doi.org/10.1038/s41598-026-43320-2
الكلمات المفتاحية: إمكانية الوصول للمكفوفين, مساعد صوتي متكيّف, ذكاء اصطناعي واعٍ بالسلوك, نماذج لغوية كبيرة, تكنولوجيا مساعدة