Clear Sky Science · ar

هياكل RAG لاسترجاع آثار الأدوية الجانبية باستخدام نماذج لغوية كبيرة مدمجة

· العودة إلى الفهرس

لماذا هذا الأمر مهم في الممارسة الطبية اليومية

من التقط وصفة طبية جديدة قد تساءل على الأرجح: «هل يمكن أن تكون هذه الحبة هي سبب صداعي أو الطفح؟» يواجه الأطباء والمرضى نفس السؤال آلاف المرات يومياً، لكن الإجابات مدفونة في كتيبات وقواعد بيانات كثيفة. تستكشف هذه الدراسة كيف يمكن لأنظمة ذكاء اصطناعي أصغر وأكثر كفاءة أن تستفيد من فهرس موجود لآثار الأدوية الجانبية المعروفة لتقدم إجابات سريعة ودقيقة ومبنية على الأدلة — دون اختلاق معلومات.

Figure 1
الشكل 1.

تحدي تتبع الآثار الجانبية للأدوية

تعد الآثار الجانبية للأدوية سبباً رئيسياً للمرض وزيارات المستشفى وحتى الوفاة على مستوى العالم. تظهر أدوية جديدة أسرع مما يمكن للأطباء المنشغلين حفظ مخاطرها، ويزداد تردد المرضى بحالات علاجية معقدة. الأدوات التقليدية — الكتيبات المطبوعة والسجلات الطبية الإلكترونية وأنظمة الإبلاغ — قوية لكنها بطيئة في البحث ضمن عيادة مزدحمة. تبدو النماذج اللغوية الكبيرة، نوع الذكاء الاصطناعي وراء الروبوتات الحوارية، مثالية لأنها تستطيع الإجابة بلغة بسيطة. ومع ذلك، عند طرح أسئلة محددة مثل «هل يسبب هذا الدواء هذا العرض الجانبي بالذات؟»، فإن النماذج الجاهزة، بما في ذلك الكبيرة منها، غالباً ما تخمن أو تتوهَم، مما يعطي إجابات لا تتوافق مع أفضل الأدلة المتاحة.

تعليم الذكاء الاصطناعي أن يبحث بدلاً من أن يخمن

يتعامل المؤلفون مع هذه المشكلة بتغيير طريقة وصول الذكاء الاصطناعي إلى المعلومات بدلاً من مجرد تكبير النماذج. يبدأون من مورد مُنقّح يُدعى SIDER، وهو قاعدة بيانات تسرد الأدوية المتداولة المرتبطة بأي آثار جانبية معروفة. ثم يبنون نظامين «كتاب مفتوح» لا يعتمدان على ما تعلّمه النموذج أثناء التدريب فحسب، بل يبحثان صراحة عن الحقائق ذات الصلة عند وقت السؤال ويزوّدان نموذجاً لغوياً مدمجاً بها. في النهج النصي، تُخزن معلومات الدواء-الآثار الجانبية كمدخلات مكتوبة ويُبحث عنها باستخدام محرك تشابه يعثر على المقتطفات الأكثر صلة. في النهج القائم على الرسوم والمعروف باسم GraphRAG، يمثل كل دواء وكل أثر جانبي عقدة في شبكة، والرابط بينهما يعني أن هذا الأثر أُبلغ عنه لذلك الدواء. تختتم كلا النظامين بطلب من نموذج لغوي صغير أن ينتج إجابة بسيطة بنعم أو لا، بالإضافة إلى شرح قصير يرتكز فقط على الأدلة المسترجعة.

Figure 2
الشكل 2.

كيف يغيّر نهج الرسم المعرفي قواعد اللعبة

لاختبار هذه التصميمات، أنشأت الفريق معيار تقييم كبير ومتوازن يضم ما يقرب من عشرين ألف زوج دواء–أثر جانبي مستمد من SIDER. لكل دواء، تضمّنوا بعض الآثار الجانبية المعروفة المرتبطة به والبعض الآخر غير المرتبط. النماذج اللغوية المدمجة العاملة بمفردها، بدون أي استرجاع، حصلت فقط على نحو ثلثي الإجابات الصحيحة — مشابهة أو أسوأ من روبوتات المحادثة العامة الشهيرة. بمجرد إضافة الاسترجاع، قفز الأداء. إعداد قائم على النص يخزن جملة واحدة لكل زوج دواء–أثر جانبي وصل إلى نحو 98–99% دقة. وذهب GraphRAG القائم على الرسم المعرفي أبعد من ذلك، محققاً درجات تكاد تكون كاملة: في تقريباً كل حالة، إذا وُجد الرابط في SIDER أجاب النظام بنعم، وإذا لم يكن موجوداً فالإجابة كانت لا. الأخطاء القليلة المتبقية جاءت من صياغة النموذج اللغوي النهائية، وليس من عملية الاسترجاع الأساسية.

العثور على كل الأدوية التي تسبب عرضاً واحداً

فحص المؤلفون أيضاً السؤال العكسي الذي يهتم به الأطباء غالباً: «ما الأدوية المعروفة بتسببها في هذا العرض الجانبي المحدد؟» هنا، بدلاً من قرار نعم/لا واحد، يجب على النظام سرد كل الأدوية المطابقة. مرة أخرى، تألق النهج القائم على الرسم المعرفي. لأنه ببساطة يتوسع من عقدة أثر جانبي معينة إلى جميع العقد الدوائية المرتبطة، يعيد القائمة الدقيقة بزمن استجابة منخفض للغاية، حتى عندما تكون هناك مئات الأدوية متضمنة. يمكن لطريقة نصية قوية أن تقترب من نفس الشمولية، لكنها تفعل ذلك فقط عن طريق مسح وتجميع العديد من أجزاء النص المنفصلة، مما يجعلها أبطأ بشكل كبير. أضاف الفريق أيضاً خطوة تطبيع صغيرة تستخدم نموذجاً لغوياً مدمجاً لتصحيح الأخطاء الإملائية الشائعة لأسماء الأدوية قبل الاستعلام، مما حسّن بشكل كبير الصلابة أمام استفسارات العالم الواقعي مثل «floxetine» بدلاً من «fluoxetine».

ماذا يعني هذا للمرضى والأطباء

بعبارات بسيطة، تُظهر هذه الدراسة أن أذكى طريقة لجعل الذكاء الاصطناعي أكثر أماناً في أسئلة الآثار الجانبية للأدوية ليست ببساطة بناء نماذج أكبر وأكبر، بل ربط نماذج أصغر بمعرفة طبية مُنظَّمة جيداً. من خلال تمثيل روابط الدواء–الأثر كرسوم بسيطة وإجبار الذكاء الاصطناعي على تأسيس إجاباته على ذلك الهيكل، يستطيع المؤلفون تقريباً القضاء على التخمين بالنسبة للروابط المفهرسة. النتيجة هي نظام يمكنه بسرعة إخبار الطبيب أو المريض ما إذا كان العرض المبلغ عنه يظهر في قائمة آثار جانبية موثوقة، وما الأدوية المرتبطة به، مع شرح الإجابة بلغة يومية. وعلى الرغم من أنه لا يكتشف آثاراً جانبية جديدة ولا يحل محل الحكم السريري الدقيق، يقدم هذا النهج أساساً عملياً وقابلاً للتوسع لأدوات تفاعلية موثوقة تساعد الناس على التنقل بين مخاطر الأدوية التي يتناولونها.

الاستشهاد: Nygren, S., Erdogan, O., Avci, P. et al. RAG-based architectures for drug side effect retrieval using compact LLMs. Sci Rep 16, 12754 (2026). https://doi.org/10.1038/s41598-026-41495-2

الكلمات المفتاحية: آثار جانبية للأدوية, الذكاء الاصطناعي الطبي, رسوم معرفية, التوليد المعزز بالاسترجاع, مراقبة الأدوية