Clear Sky Science · ar

تصنيف تقارير عيوب المنتجات الصحية باستخدام التعلم العميق

· العودة إلى الفهرس

لماذا يهم اكتشاف الأدوية الفاسدة بسرعة أكبر

يفترض معظمنا أن الأدوية والمنتجات الصحية التي نستخدمها آمنة ومصنّعة وفق معايير جودة صارمة. ومع ذلك، يتم سحب مئات المنتجات الدوائية في أنحاء العالم كل عام بسبب التلوث أو المكونات غير الصحيحة أو الملصقات المضللة. كل منتج معيب يمثل تهديدًا محتملاً للمرضى. يجب على الجهات المنظمة قراءة وترجمة آلاف تقارير العيوب بسرعة لتقرر أيها يتطلب اتخاذ إجراء عاجل. يصف هذا البحث كيف بُني نظام تعلم عميق لمساعدة الجهات الصحية على تصنيف هذه التقارير بشكل أسرع وأكثر اتساقًا، حتى تتمكن من تركيز الانتباه على المشكلات ذات الخطورة الأكبر على الصحة العامة.

كيف تُبلغ عن مشاكل المنتجات اليوم

عندما يُكتشف عيب محتمل في دواء أو منتج صحي آخر، يُرسل تقرير مكتوب موجز إلى الجهات المنظمة. يمكن أن تصف هذه التقارير قضايا متعددة: شظايا زجاج في قارورة، مكون خاطئ في حبة دواء، تغليف يتسرب، أو ملصقات قد تؤدي إلى أخطاء في الجرعات. في سنغافورة، تستخدم هيئة العلوم الصحية قاموسًا طبيًا معياريًا مُكيَّفًا للاحتياجات المحلية لتجميع كل تقرير ضمن واحدة من عدة فئات محددة، مثل التلوث الميكروبي أو الإعلان المخالف للقواعد. تُساعد الفئة المخصصة للتقرير في تحديد مدى خطورة المشكلة وسرعة التعامل معها. في الوقت الراهن، يقرأ الضباط المدربون كل تقرير ويضعون وسمًا يدويًا. هذه العملية بطيئة ومعقدة وقد تكون غير متسقة، خصوصًا مع تزايد عدد التقارير.

Figure 1
شكل 1.

تعليم الحاسوب قراءة تقارير العيوب

سعى الباحثون لبناء نظام ذكاء اصطناعي يدعم هؤلاء الضباط بدلاً من استبدالهم. جمعوا 13,830 تقرير عيب استلمت بين 2010 و2021، شملت أدوية ولقاحات ومكملات ومستحضرات تجميل. راجع فريق من الصيادلة ذوي الخبرة كل تقرير بعناية ووضع له وسمًا باستخدام 21 من أكثر فئات العيوب شيوعًا، التي غطت معًا أكثر من 99٪ من الحالات. ثم استخدم الفريق نموذجًا لغويًا شائعًا يسمى BERT، المصمم لفهم معاني الكلمات في سياقاتها، كنواة لنظامهم. من خلال ضبط BERT على هذه المجموعة المعلّمة، أنشأوا أداة — سموها MedDefects‑BERT — التي تقرأ عنوان التقرير ووصفه وتتنبأ بفئة العيب الأكثر احتمالًا.

مدى كفاءة أداء النظام

عند اختباره على تقارير لم يسبق له رؤيتها، طابق MedDefects‑BERT اختيار الخبراء الأول بنسبة 86٪ من الوقت. وإذا سُمح للنظام باقتراح أكثر ثلاث فئات احتمالًا، فقد تضمن الصحيح 96٪ من الوقت. هذا مهم لأن الضابط الحقيقي يمكنه ببساطة مراجعة قائمة قصيرة من الاقتراحات بدلاً من البدء من الصفر. عمل النظام بشكل أفضل للفئات التي تضمن أمثلة تدريبية أكثر، وهو أمر مألوف في تعلم الآلة. ومع ذلك، فإن السماح بما يصل إلى ثلاث تسميات مقترحة رفع الأداء إلى ما فوق 70٪ لكل فئة، بما في ذلك الفئات الأقل شيوعًا. كانت درجات ثقة النموذج — أرقام بين 0 و1 تدل على مستوى اليقين — مرتبطة بقوة بمدى صحة توقعاته. من خلال تحديد حد ثقة، أظهر الفريق أنهم يستطيعون رفع الدقة إلى نحو 91٪ في التنبؤات «التي وُجدت بأنها مؤكدة» مع الإشارة إلى جزء متواضع من الحالات على أنها «غير مؤكدة» للمراجعة البشرية الدقيقة.

Figure 2
شكل 2.

إلقاء نظرة داخل قرارات النموذج

تناول المؤلفون أيضًا قلقًا رئيسيًا مرتبطًا بالذكاء الاصطناعي في مجالات ذات حساسية سلامة: الشفافية. استخدموا أدوات تصويرية لإظهار أن التقارير المنتمية إلى نفس نوع العيب تتجمع معًا في «خريطة» داخلية لمعاني الوثائق لدى النموذج، بينما تقع التقارير المصنفة خطأ عند حواف بين التجمعات. وعلى مستوى الكلمات الفردية، طبقوا طريقة تسمى SHAP لتسليط الضوء على المصطلحات التي دفعت النموذج نحو فئة معينة. على سبيل المثال، الكلمات المرتبطة بالفطريات أو العفن أثرت بقوة في التنبؤات المتعلقة بالتلوث الميكروبي، بينما دعمت مصطلحات مثل «رواسب» أو «ترسّب» فئة مرتبطة بالترسبات في المنتجات. تمنح هذه التوضيحات الضباط وسيلة سريعة لرؤية سبب اقتراح النموذج وتقييم ما إذا كان منطقيًا في السياق.

جعل النظام أذكى وأكثر كفاءة

لتحسين الأداء أكثر دون إضافة تكاليف حوسبية كبيرة، استخدم الفريق تقنية معروفة بضبط الموجهات العميقة. بدلًا من تغيير كل الإعدادات الداخلية للنموذج، أضافوا «بادئات» صغيرة قابلة للتدريب لكل طبقة توجه النموذج بلطف نحو هذه المهمة المحددة. جمع الضبط التقليدي مع هذه الموجهات حسن دقة النظام في أكثر من نصف فئات العيوب وحسّن قدرته على الكشف الصحيح عن الحالات عمومًا. أظهرت الاختبارات على تقارير أحدث من عام 2022 أن دقة النظام حافظت على مستوى جيد مع مرور الوقت، مما يوحي بأن فهمه لتقارير العيوب لم ينهَر بسرعة مع الزمن.

ماذا يعني هذا للمرضى والجهات المنظمة

تُظهر الدراسة أن نموذجًا لغويًا مصممًا جيدًا يمكن أن يساعد الجهات المنظمة بشكل كبير في فرز أحجام كبيرة من تقارير عيوب المنتجات الصحية، وتوحيد طريقة تصنيف الحالات، وتسليط الضوء بسرعة على المشكلات عالية المخاطر. وبما أن النظام يشرح أيضًا الكلمات والمقاطع التي دفعت اقتراحاته، يظل الخبراء البشريون متحكمين بالقرارات النهائية. مع مزيد من التحسين — مثل التعامل مع أنواع عيوب متعددة في تقرير واحد والتوسع إلى فئات أندر — يمكن لأدوات مماثلة تعزيز مراقبة جودة الأدوية عالميًا، وتقليل التأخير في سحب المنتجات الخطرة، وفي النهاية تقديم حماية أفضل للمرضى.

الاستشهاد: Sancenon, V., Huang, Y., Zou, L. et al. Classification of health product defect reports by deep learning. Sci Rep 16, 13528 (2026). https://doi.org/10.1038/s41598-026-43961-3

الكلمات المفتاحية: سلامة الأدوية, جودة الأدوية, التعلم العميق, مراقبة تنظيمية, معالجة اللغة الطبيعية