Clear Sky Science · he
מיון דיווחי ליקויים במוצרי בריאות בעזרת למידה עמוקה
מדוע חשוב לגלות תרופות פגומות מהר יותר
יותרינו מניחים שהתרופות ומוצרי הבריאות שבהם אנו משתמשים בטוחים ומיוצרים לפי תקני איכות מחמירים. ובכל זאת, ברחבי העולם מאות מוצרי תרופות נסגרים בכל שנה בגלל זיהום, מרכיבים שגויים או תוויות מטעות. כל מוצר פגום הוא איום פוטנציאלי על המטופלים. רשויות הרגולציה חייבות לקרוא ולפרש במהירות אלפי דיווחי ליקויים כדי להחליט אילו מהם דורשים פעולה דחופה. מאמר זה מתאר כיצד נבנה מערכת למידה עמוקה שמסייעת לשלטונות הבריאות למיין דיווחים אלה במהירות ובאופן עקבי יותר, כדי שיוכלו למקד את תשומת הלב בבעיות הנושאות בסיכון הגבוה ביותר לבריאות הציבור.
כיצד מדווחים על בעיות במוצרים כיום

ללמד מחשב לקרוא דיווחי ליקויים
החוקרים שואפים לבנות מערכת בינה מלאכותית שתתמוך בקצינים אלה במקום להחליפם. הם אספו 13,830 דיווחי ליקוי שהתקבלו בין 2010 ל-2021, כולל תרופות, חיסונים, תוספים וקוסמטיקה. צוות של רוקחים מנוסים בדק ולתייג כל דיווח בקפידה באמצעות 21 מקטגוריות הליקוי הנפוצות ביותר, שכיסו יחד יותר מ-99% מכל המקרים. לאחר מכן השתמשו במודל שפה פופולרי בשם BERT, המתוכנן להבין את משמעות המילים בהקשר, כגרעין המערכת. באמצעות כוונון מדויק של BERT על אוסף מתויג זה הם יצרו כלי — שנקרא MedDefects‑BERT — שיכול לקרוא את כותרת הדיווח ותיאורו ולחזות את קטגוריית הליקוי הסבירה ביותר.
כמה טוב המערכת מתפקדת
כאשר נבחן על דיווחים שטרם ראה, MedDefects‑BERT התאמה לבחירת המומחים הראשית ב-86% מהמקרים. אם המערכת הורשתה להציע את שלוש הקטגוריות הסבירות ביותר, היא כללה את הקטגוריה הנכונה ב-96% מהמקרים. זה חשוב משום שקצין אמיתי יכול פשוט לסקור רשימה קצרה של הצעות במקום להתחיל מאפס. המערכת עבדה טוב יותר עבור קטגוריות עם דוגמאות אימון רבות יותר, זה אופייני ללמידת מכונה. עם זאת, מתן עד שלוש תוויות מוצעות העלה את הביצועים מעל 70% בכל קטגוריה, כולל הנדירות יותר. ציוני הביטחון של המודל — מספרים בין 0 ל-1 שמצביעים על רמת הביטחון שלו — היו קשורים בחוזקה לשכיחות נכונותו. על-ידי קביעת סף ביטחון, הצוות הראה כי ניתן להעלות את הדיוק לכימעין 91% עבור תחזיות "ודאיות" תוך שמירה של חלק צנוע מהמקרים כ"לא ודאיים" לבחינה אנושית מעמיקה יותר.

בדיקה פנימית של החלטות המודל
המחברים גם התמודדו עם דאגה מרכזית לגבי בינה מלאכותית בתחומי בטיחות קריטיים: שקיפות. הם השתמשו בכלי ויזואליזציה כדי להראות שדיווחים השייכים לאותו סוג ליקוי מצטברים יחד ב"מפה" הפנימית של משמעות המסמכים במודל, בעוד דיווחים שסווגו בטעות יושבים בקצוות בין צברים. ברמת המילים הבודדות, הם יישמו שיטה בשם SHAP כדי להדגיש אילו מונחים בדיווח דחפו את המודל לכיוון קטגוריה מסוימת. למשל, מילים הקשורות לפטריות או לעובש השפיעו בחוזקה על תחזיות של זיהום מיקרוביאלי, בעוד מונחים כמו "משקע" או "התקבצות" תמכו בקטגוריה הקשורה להצטברויות במוצרים. ההסברים האלה נותנים לקצינים דרך מהירה לראות מדוע המודל הציע משהו ולשפוט האם זה הגיוני בהקשר.
להפוך את המערכת לחכמה ויעילה יותר
כדי לשפר עוד את הביצועים בלי להוסיף עלויות חישוב כבדות, הצוות השתמש בטכניקה הידועה ככוונון פרומפט עמוק. במקום לשנות את כל הגדרות המודל הפנימיות, הם הוסיפו "קידומות" קטנות הניתנות לאימון בכל שכבה שמכוונות בעדינות את המודל למשימה הספציפית הזו. שילוב של כוונון מסורתי עם פרומפטים אלה שיפר את דיוק המערכת ביותר מחצי מהקטגוריות ושיפר את יכולתה לזהות מקרים נכון באופן כללי. בדיקות על דיווחים חדשים מ-2022 הראו שדיוקה של המערכת נשאר יציב לאורך זמן, מה שמעיד שהבנתה לגבי דיווחי ליקויים אינה מתיישנת במהירות.
מה משמעות הדבר למטופלים ולרגולטורים
הממצאים מראים שמודל שפה מעוצב היטב יכול לסייע לרשויות למיין במהירות כמויות גדולות של דיווחי ליקויים במוצרי בריאות, לאחד את אופן סיווג המקרים ולזהות בעיות בסיכון גבוה מהר יותר. מכיוון שהמערכת גם מסבירה אילו מילים וקטעים הניעו את הצעותיה, המומחים האנושיים נשארים בשליטה מלאה על ההחלטות הסופיות. עם שיפורים נוספים — כגון טיפול במספר סוגי ליקויים בדיווח אחד והרחבה לקטגוריות נדירות יותר — כלים דומים יכולים לחזק את המעקב אחרי איכות תרופות בעולם, לקצר עיכובים בקריאות לסגירת מוצרים מסוכנים ולספק בסופו של דבר הגנה טובה יותר על המטופלים.
ציטוט: Sancenon, V., Huang, Y., Zou, L. et al. Classification of health product defect reports by deep learning. Sci Rep 16, 13528 (2026). https://doi.org/10.1038/s41598-026-43961-3
מילות מפתח: בטיחות תרופות, איכות תרופות, למידה עמוקה, פיקוח רגולטורי, עיבוד שפה טבעית