Clear Sky Science · he

ארכיטקטורות מבוססות RAG לשליפת תופעות לוואי של תרופות באמצעות LLM קומפקטיים

2026-03-09 · חזרה לאינדקס

למה זה חשוב ברפואה היומיומית

כל מי שקיבל מרשם חדש כנראה שאל את עצמו פעם, "האם הגלולה הזאת עלולה לגרום לכאב ראש או לפריחה?" רופאים ומטופלים מתמודדים עם השאלה הזו אלפי פעמים ביום, אך התשובות שקועות בספרי עיון וכספים צפופים ומסדי נתונים. מחקר זה בוחן כיצד מערכות בינה מלאכותית קטנות ויעילות יותר יכולות לנצל קטלוג קיים של תופעות לוואי ידועות כדי לספק תשובות מהירות, מדויקות ומגובה בראיות — מבלי להמציא פרטים.

האתגר של מעקב אחרי תופעות לוואי של תרופות

תופעות לוואי של תרופות הן גורם מרכזי למחלה, לאשפוזים ואף לתמותה ברחבי העולם. תרופות חדשות מגיעות בקצב שמעסיק רפואי עסוק מתקשה לזכור את סיכוניהן, ומטופלים מגיעים יותר ויותר עם היסטוריות טיפולים מורכבות. כלים מסורתיים — מדריכים מודפסים, רשומות רפואיות אלקטרוניות ומערכות דיווח — חזקים אך איטיים לחיפוש בסביבה קלינית עמוסה. מודלים שפתיים גדולים, הטכנולוגיה מאחורי צ׳אטבוטים, נראים מתאימים כי הם יכולים לענות בשפה טבעית. עם זאת, כששואלים שאלות ספציפיות כמו "האם תרופה זו גורמת לתופעת לוואי מסוימת?", מודלים זמינים מסחרית, כולל מאוד גדולים, נוטים לנחש או להציג הזיות ולתת תשובות שאינן תואמות את הראיות הטובות ביותר הקיימות.

ללמד את ה-AI לחפש במקום לנחש

המחברים מתמודדים עם הבעיה על ידי שינוי הדרך שבה ה-AI ניגש למידע, במקום להגדיל רק את גודל המודל. הם מתחילים ממקור מבוקר שנקרא SIDER, מסד נתונים שמפרט אילו תרופות משווקות מקושרות אילו תופעות לוואי. לאחר מכן הם בונים שתי מערכות "ספר פתוח" שבמקום להישען על מה שהמודל למד בזמן האימון, מחפשות במפורש עובדות רלוונטיות בזמן השאלה ומעבירות אותן למודל שפה קומפקטי. בגישה מבוססת טקסט, מידע על זוגות תרופה–תופעת לוואי מאוחסן כניסים כתובים ומחופש בעזרת מנוע דמיון שמוצא את הקטעים הרלוונטיים ביותר. בגישה מבוססת גרף, שנקראת GraphRAG, כל תרופה וכל תופעת לוואי הם צומת ברשת, וקישור ביניהם מציין שהתופעה דווחה עבור אותה תרופה. שתיהן מסיימות בבקשה ממודל שפה קטן להפיק תשובה פשוטה של כן או לא, בתוספת הסבר קצר המגובה אך ורק בראיות שנשלפו.

כיצד הגישה הגרפית משנה את המצב

כדי לבדוק עיצובים אלה, הצוות יצר סט מבחן גדול ומאוזן של כמעט עשרים אלף זוגות תרופה–תופעת לוואי שנגזרו מ-SIDER. עבור כל תרופה, כללו כמה תופעות לוואי שידוע כי קשורות אליה ואחרות שאינן קשורות. מודלים שפתיים קומפקטיים שפעלו לבדם, ללא שליפה, השיגו רק כ־שני שלישים תשובות נכונות — בדומה או גרועים יותר מצ׳אטבוטים פופולריים כלליים. לאחר שהתווספה שליפה, הביצועים קפצו. תצורה מבוססת טקסט ששמרה משפט אחד לכל זוג תרופה–תופעה הגיעה לדיוק של כ־98–99%. הגישה הגרפית GraphRAG הלכה עוד רחוק יותר, והשיגה תוצאות כמעט מושלמות: ברוב המקרים, אם הקישור קיים ב‑SIDER המערכת השיבה כן, ואם לא — לא. השגיאות המועטות שנותרו נבעו מהניסוח הסופי של מודל השפה, לא מהחיפוש עצמו.

למצוא את כל התרופות שעומדות מאחורי תסמין אחד

המחברים בחנו גם את השאלה ההפוכה שחשובה לרופאים: "אילו תרופות ידועות כגורמות לתופעת לוואי מסוימת זו?" כאן, במקום החלטת כן/לא בודדת, המערכת חייבת למנות את כל התרופות המתאימות. שוב, הגישה הגרפית בלטה. כיוון שהיא פשוט מרחיבה מקשר צומת תופעת לוואי לכל הצמתים של תרופות שמחוברים אליו, היא מחזירה את הרשימה המדויקת במהירות נמוכה מאוד, אפילו כשמעורבות מאות תרופות. שיטה חזקה מבוססת טקסט יכלה להתקרב לאותה שלמות, אך רק על ידי סריקה והרכבה של חלקים רבים של טקסט — מה שהפך אותה לאיטי בהרבה. הצוות גם הוסיף שלב קטן של נרמול שמשתמש במודל שפה קומפקטי לתיקון שגיאות איות נפוצות בשמות תרופות לפני החיפוש, ושיפר משמעותית את החוסן לשאילתות בעולם האמיתי כמו "floxetine" במקום "fluoxetine".

מה זה אומר למטופלים ולרופאים

בהגדרה פשוטה, עבודה זו מראה שהדרך החכמה ביותר להפוך את ה-AI לבטוח יותר לשאלות על תופעות לוואי של תרופות אינה רק לבנות מודלים גדולים יותר, אלא לחבר מודלים קטנים יותר לידע רפואי מסודר היטב. על ידי ייצוג הקשרים הידועים בין תרופות ותופעות לוואי כגרף פשוט והכרחת ה‑AI לבסס את תשובותיו על אותו מבנה, החוקרים מצליחים כמעט לחסל ניחושים עבור אסוציאציות המופ cataloged. התוצאה היא מערכת שיכולה במהירות להגיד לרופא או למטופל האם סימפטום מדווח מופיע ברשימת תופעות הלוואי המוסמכת, ואילו תרופות מקושרות אליו, תוך הסבר התשובה בשפה יומיומית. אף שהשיטה אינה גלאית תופעות לוואי חדשות ואינה מחליפה שיקול קליני זהיר, הגישה מספקת בסיס מעשי וקביל להתקנה לממשקים אינטראקטיביים מהימנים שעוזרים לאנשים לנווט את הסיכונים של התרופות שהם משתמשים בהן.

ציטוט: Nygren, S., Erdogan, O., Avci, P. et al. RAG-based architectures for drug side effect retrieval using compact LLMs. Sci Rep 16, 12754 (2026). https://doi.org/10.1038/s41598-026-41495-2

מילות מפתח: תופעות לוואי של תרופות, בינה מלאכותית רפואית, גרפי ידע, ייצור מוכלל באמצעות שליפה, פיקוח פרמקולוגי