Clear Sky Science · ar
تحسين التعرف على الكيانات المسماة بعدد قليل من الأمثلة لنماذج اللغة الكبيرة باستخدام إرشاد ديناميكي منظم مع التوليد المعزز بالاسترجاع
لماذا يهم فهم النص الطبي بذكاء أكبر
تنتج الطب الحديث أنهاراً من النصوص—من ملاحظات العناية المركزة إلى محادثات الإنترنت حول استخدام الأدوية. تكمن في تلك الكلمات دلائل مهمة عن الأمراض والعلاجات والآثار الجانبية. إن العثور تلقائياً على هذه المقاطع ووضع تسميات لها، وهي مهمة تُعرف باسم «التعرف على الكيانات المسماة»، يمكن أن يساعد الباحثين في تتبع التفشيات، ورصد مشكلات الأدوية مبكراً، ودعم الأطباء في الوقت الحقيقي. لكن الأنظمة التقليدية تحتاج مجموعات بيانات موسومة يدوياً كبيرة، وهي مكلفة في الإنشاء وغالباً ما تكون غير متاحة للحالات النادرة أو المشكلات الصحية الناشئة. تستكشف هذه الدراسة كيف يمكن توجيه نماذج اللغة الكبيرة، مثل تلك المستخدمة في روبوتات الدردشة الحالية، عبر مطالبات مصممة بعناية واسترجاع أمثلة ذكي بحيث تنجز مهمة الوسم جيداً حتى عندما تتوفر عينات موسومة قليلة فقط.

تعليم الآلات رصد الكلمات المهمة
يركز المؤلفون على التعرف على الكيانات المسماة في المجال البيولوجي الطبي—تحديد الإشارات إلى الأمراض والأدوية والأعراض والتأثيرات الاجتماعية في النص. هذه المهمة صعبة لأن اللغة الطبية متخصصة للغاية، وتختلف باختلاف المستشفى أو التخصص الفرعي، وغالباً ما تتضمن حالات نادرة تظهر مرات قليلة فقط في أي مجموعة بيانات. تستطيع نماذج التعلم الآلي الحالية تحقيق أداء شبيه بالبشر لكنها عادةً ما تتطلب مجموعات مرجعية كبيرة وموسومة بشكل جيد، التي تكون مكلفة الإنشاء والمشاركة، خاصةً تحت قواعد خصوصية صارمة. يوفر التعلم بعدد قليل من الأمثلة طريقاً لتجاوز هذا القيد؛ إذ يتعلم النموذج من عدد قليل من الأمثلة الموسومة. وتعد نماذج اللغة الكبيرة واعدة هنا لأنها قادرة على استيعاب الأنماط مباشرة من التعليمات والأمثلة المقدمة في المطالبة دون الحاجة لإعادة تدريب أوزانها الداخلية.
بناء تعليمات أفضل لنماذج اللغة
يُصمم الجزء الأول من العمل «مطالبة» ثابتة مرتبة للغاية—وحدة تعليمات وأمثلة قابلة لإعادة الاستخدام تُعرض على النموذج لكل جملة يجب أن يوسمها. بدلاً من إخبار النموذج ببساطة بوضع وسم على الكيانات، تُقسم المطالبة إلى ستة عناصر: وصف واضح للمهمة وتعريفات أنواع الكيانات؛ وصف قصير لمصدر وموضوع مجموعة البيانات؛ كلمات أمثلة متكررة نموذجية لكل كيان؛ معرفة طبية خلفية اختيارية؛ ملاحظات ملخّصة من أخطاء النموذج السابقة؛ وعدد قليل من الجمل المعلّمة بالكامل كمثال. اختبر الفريق هذا الإطار مع ثلاثة نماذج لغة كبيرة—GPT-3.5 وGPT-4 وLLaMA 3-70B—على خمس مجموعات بيانات حيوية طبية تغطي سجلات سريرية وملخصات علمية ومنشورات على Reddit حول استخدام المواد الأفيونية. أدى ترتيب هذه المكونات بعناية إلى رفع درجات F1 (توازن الدقة والاستدعاء) بنحو 11–12 نقطة مئوية مقارنة بالمطالبة الأساسية، مع تحقيق GPT-4 أفضل أداء إجمالي.
السماح للنموذج بالبحث عن أمثلة أفضل في الوقت الفعلي
المطالبات الثابتة، مع ذلك، تعرض دائماً نفس الأمثلة حتى عندما تكون غير متوافقة مع الجملة الجديدة المطلوب وسمها. لمواجهة ذلك، يقدم المؤلفون استراتيجية مطالبة «ديناميكية» مدعومة بالتوليد المعزز بالاسترجاع. في هذا النهج، يفهرس محرك استرجاع منفصل كل الأمثلة الموسومة المتاحة. لكل جملة إدخال جديدة، يبحث النظام في هذا التجمع لإيجاد الجمل الموسومة الأكثر تشابهاً ويُدرجها فقط في المطالبة. تقارن الدراسة عدة طرق استرجاع، بدءاً من مخطط تكرار المصطلحات البسيط (TF–IDF) إلى نماذج التضمين العصبية مثل Sentence-BERT (SBERT) وColBERT وDense Passage Retrieval. عبر GPT-4 وLLaMA 3 ونموذج مفتوح الوزن يُدعى GPT-OSS-120B، تفوق اختيار الأمثلة الديناميكي ذات الصلة باستمرار على المطالبة الثابتة في إعدادات 5 و10 و20 مثالاً. وبشكل مدهش، طابق أو تفوق أسلوب TF–IDF البسيط غالباً على الطرق الأكثر تعقيداً، خاصةً في مجموعات البيانات الأنظف والأكثر معيارية، بينما تميز SBERT في النصوص الأكثر ضوضاءً مثل المنشورات على وسائل التواصل الاجتماعي.
الحصول على المزيد من القيم من عدد أقل من الأمثلة الموسومة
نظراً لأن وسم النص الطبي مكلف، درس المؤلفون أيضاً عدد الأمثلة الموسومة التي يجب على محرك الاسترجاع فهرستها ليكون مفيداً. باستخدام LLaMA 3-70B، تنوع حجم تجمع الاسترجاع من 50 مثالاً حتى مجموعة التدريب بأكملها. عموماً تحسّن الأداء مع نمو التجمع، لكن المكاسب تناقصت بسرعة: مجموعات من نحو 100–200 مثال حققت تقريباً نفس الدقة كفهرسة كل البيانات المتاحة، غالباً ضمن هامش الخطأ الإحصائي. في بعض الحالات، أدى التجمع الكبير جداً إلى إضعاف الأداء قليلاً، ربما لأنه قدم أمثلة غير ذات صلة أو مربكة وزاد طول المطالبة. تشير هذه النتائج إلى أنه عند إقرانه بنموذج لغة قوي ومطالبات مصممة جيداً، قد تؤدي جهود وسم معتدلة إلى تحقيق تعرف قوي على الكيانات الطبية، مما يجعل النهج قابلاً للتطبيق للأمراض النادرة والمفاهيم السريرية الجديدة أو المؤسسات ذات الموارد المحدودة.

ماذا يعني هذا للطب في العالم الواقعي
بشكل عام، تُظهر الدراسة أن نماذج اللغة الكبيرة قادرة على استخلاص المفاهيم الطبية المهمة من النص بشكل موثوق باستخدام عدد قليل من الأمثلة الموسومة فقط، شريطة أن تُوجه بمطالبات مُنظمة ونظام استرجاع يعرّضها للحالات السابقة الأنسب. يقدم GPT-4 أقوى أداء عام، بينما تستفيد النماذج المفتوحة والأصغر حجماً أيضاً استفادة كبيرة من نفس وصفة المطالبة والاسترجاع. بالنسبة للممارسين، هذا يعني أنهم لا يحتاجون إلى بناء مجموعات بيانات هائلة في كل مرة يظهر فيها نوع كيان جديد أو قلق صحي؛ فمجموعة مدمجة ومختارة بعناية من الأمثلة إلى جانب إرشاد ذكي قد تكون كافية. ومع استمرار رقمنة أنظمة الرعاية الصحية ومناقشة المرضى لتجاربهم عبر الإنترنت، يمكن أن تجعل هذه الأدوات الفعالة والقابلة للتكيف الأمر أسهل بكثير لاستخراج معرفة سريرية مفيدة من العالم الواسع والفوضوي للنص الطبي.
الاستشهاد: Ge, Y., Guo, Y., Das, S. et al. Improving few-shot named entity recognition for large language models using structured dynamic prompting with retrieval augmented generation. npj Artif. Intell. 2, 39 (2026). https://doi.org/10.1038/s44387-025-00062-2
الكلمات المفتاحية: التعرف على الكيانات المسماة في الطب الحيوي, التعلم بعدد قليل من الأمثلة, نماذج اللغة الكبيرة, التوليد المعزز بالاسترجاع, استخراج النصوص السريرية