Clear Sky Science · ar
مجموعة من نماذج اللغة الكبيرة لرصد معلومات الصحة العامة
لماذا يهم الجدل عبر الإنترنت للصحة العامة
خلال التفشّيات والذعر الصحي، يتجه كثير من الناس أولاً إلى وسائل التواصل الاجتماعي بدلاً من المواقع الرسمية أو الأطباء. تكشف هذه المنشورات عما يخشاه الناس، وما يسيئون فهمه، وكيف يستجيبون للتوجيهات. الدراسة الموصوفة هنا تقدّم PH-LLM، عائلة من نماذج الذكاء الاصطناعي المُصمَّمة خصيصاً لقراءة هذا التدفق المستمر من الرسائل عبر الإنترنت بعدة لغات، لمساعدة المسؤولين الصحيين على رصد المشكلات مبكراً والاستجابة قبل أن تتصاعد الشائعات والمخاوف خارج السيطرة.
مراقبة المحادثات الصحية في الوقت الحقيقي
لطالما اعتمدت هيئات الصحة العامة على الاستبيانات وتقارير العيادات والبيانات المخبرية لتوجيه قراراتها. لكن هذه الأدوات التقليدية بطيئة وغالباً ما تفقد المزاج المتغير بسرعة على الإنترنت، حيث تنتشر المعتقدات حول اللقاحات والاختبارات والأمراض الجديدة في غضون ساعات. يسمي الباحثون جهود تتبع هذا النبض الرقمي «مراقبة المعلومات»—مراقبة المعلومات بدل الإصابات. حتى الآن، اعتمدت معظم هذه المحاولات على نماذج تعلم آلي أصغر مُدرَّبة لمهمة واحدة في كل مرة، مثل الكشف عن التردد تجاه اللقاحات في تغريدات باللغة الإنجليزية. وكانت هذه الأنظمة تواجه صعوبة في مواكبة ظهور قضية أو لغة أو منصة جديدة.

حزمة ذكاء اصطناعي مصممة لأسئلة الصحة العامة
لمعالجة هذه الفجوة، طوّر المؤلفون PH-LLM، مجموعة من نماذج اللغة الكبيرة المخصّصة لمراقبة معلومات الصحة العامة. انطلاقاً من نموذج أساسي متعدد اللغات قوي، قاموا بتخصيص ستة إصدارات، تتراوح من خفيفة الوزن إلى أكبر حجماً، باستخدام ما يقرب من 600,000 مثال مستخلص من 30 مجموعة بيانات لوسائل التواصل الاجتماعي والعديد من مصادر الأسئلة والأجوبة الصحية. غطت هذه الأمثلة مزيجاً واسعاً من الموضوعات، بما في ذلك المواقف تجاه اللقاحات، والتردد في إجراء الاختبارات، وإشارات الصحة العقلية، وخطاب الكراهية، والمعلومات المضللة عن كوفيد-19 وقضايا أخرى. بدلاً من إعادة كتابة كل منشور بالإنجليزية، احتفظوا باللغات الأصلية ودمجوها مع قوالب تعليمات مترجمة إلى 29 لغة، حتى تتمكن النماذج من التعامل بطبيعة مع المحتوى المختلط وغير الإنجليزي.
اختبار PH-LLM في تحدٍّ قاسٍ
لاكتشاف مدى كفاءة PH-LLM فعلاً، بنى الفريق معيار تقييم صارماً مكوَّناً من 39 مهمة غير مرئية مستمدة من 10 مجموعات بيانات منفصلة باللغات الإنجليزية والعربية والصينية والإندونيسية. طُلِب من النماذج القيام بمهام مثل فصل القصص الشخصية عن الأخبار، ووضع علامة على خطاب الكراهية، وتحديد الادعاءات الكاذبة حول العلاجات، والكشف عن تغير المشاعر تجاه لقاحات كوفيد-19. عملت PH-LLM في إعداد «صفر-تدريب» (zero-shot)، بمعنى أنها لم تتلقَ تدريباً إضافياً لأي مهمة محددة. وقارن الباحثون دقة PH-LLM بمجموعة واسعة من الأنظمة المعروفة، بما في ذلك نماذج مفتوحة المصدر مثل Llama وMistral وBLOOMZ وQwen، وكذلك نماذج تجارية مثل GPT-4o وGPT-4o mini.
أصغر حجماً ولكن أقوى عبر اللغات
عبر مهام أحادية اللغة الإنجليزية ومتعددة اللغات، لم تكتفِ نماذج PH-LLM بالمنافسة فحسب، بل تفوقت غالباً على البدائل المماثلة أو حتى الأكبر حجماً. قدّمت الإصدارات ذات 14 مليار و32 مليار معلمة أفضل أداء إجمالي، متجاوزة نماذج مفتوحة المصدر الأكبر وحتى عائلة GPT-4o التجارية في المتوسط على معيار الاختبار. والأهم أن الدرجات الأعلى متعددة اللغات تعني أن PH-LLM قادرة على تتبع المحادثات المتعلقة بالصحة بالعربية والصينية والإندونيسية ولغات أخرى غالباً ما تُهمل. وبما أن PH-LLM تحقق هذا المستوى من الدقة بعدد معلمات أقل من كثير من المنافسين، فيمكن تشغيلها على أجهزة حاسوبية أكثر تواضعاً، مما يخفض التكاليف لوكالات الصحة، لا سيما في البلدان منخفضة ومتوسطة الدخل.

من الإشارات الإلكترونية إلى القرارات في العالم الواقعي
يتصور المؤلفون PH-LLM كأداة عملية يمكن للعاملين في الصحة العامة غير التقنيين استخدامها عبر واجهات بسيطة. عند دمج تصنيفات PH-LLM مع معلومات عن الزمن والمكان والظروف المحلية، يمكن أن تكشف أين يتصاعد الشك تجاه اللقاحات، وأي المجتمعات تتعرض لخطاب الكراهية، أو متى تبدأ الشائعات الخطيرة في الانتشار. ومع أن النماذج ما تزال لها حدود—مثل الأداء غير المتوازن في المهام الصعبة جداً أو غير المتكافئة والتحيّزات المحتملة الموروثة من بيانات وسائل التواصل الاجتماعي—فهي خطوة كبيرة نحو مراقبة المحادثات الصحية متعددة اللغات في الوقت الحقيقي. ببساطة، تحوّل PH-LLM التدفق الصاخب لوسائل التواصل الاجتماعي إلى إشارات أوضح تساعد السلطات على التصرف بسرعة وبإنصاف أثناء الحملات اليومية وفي الأوبئة المستقبلية.
الاستشهاد: Zhou, X., Zhou, J., Wang, C. et al. A suite of large language models for public health infoveillance. npj Digit. Med. 9, 270 (2026). https://doi.org/10.1038/s41746-026-02435-6
الكلمات المفتاحية: مراقبة الصحة العامة, معلومات مضللة على وسائل التواصل الاجتماعي, التردد تجاه اللقاحات, الذكاء الاصطناعي متعدد اللغات, نماذج اللغة الكبيرة