Clear Sky Science · he
CancerLLM: מודל שפה גדול בתחום הסרטן
למה זה חשוב למטופלים ולרופאים
טיפול בסרטן נשען על הבנת כמויות עצומות של טקסט — מרשומות רופאים ועד דוחי מעבדה. רוב מערכות הבינה המלאכותית שקוראות את הטקסט הזה הן כלליות, לא מומחיות בסרטן, ולעתים קרובות גדולות, יקרות וקשות להפעלה בבתי חולים. מאמר זה מציג את CancerLLM, מודל שפה קטן יותר שאומן במיוחד על רשומות סרטן ומבטיח סיוע מדויק יותר בהבנת מחלת המטופל — ובצריכת משאבים חישוביים נמוכה בהרבה.

Assistant דיגיטלי חדש המתמקד בסרטן
החוקרים שאפו לבנות מודל שפה ש"חושב" בשפה של אונקולוגיה. במקום לגרוף את האינטרנט הפתוח, הם אימנו את CancerLLM על 2.7 מיליון רשומות קליניות של סרטן ועל יותר מחצי מיליון דוחות פתולוגיה מיותר מ‑30,000 מטופלים ב‑17 סוגי סרטן, כולל שד, ריאה, קולון ולוקמיה. הם התחילו ממבנה מודל קיים של 7 מיליארד פרמטרים והמשיכו לאמן אותו על החומר העשיר בסרטן, ולאחר מכן עברו לשלב שני שבו לימדו את המודל לעקוב אחר הנחיות בסגנון משימות, בדומה לאופן שבו רופא עשוי לשאול עוזר דיגיטלי.
עוזר לחלץ פרטים מרכזיים מדוחות מורכבים
משימה מרכזית עבור CancerLLM היא "חילוץ פנוטיפ": חילוץ תכונות ספציפיות של הסרטן מטקסט חופשי. תכונות אלה כוללות מיקום הגידול, גודלו, דרגתו ובמה הוא נמצא, ומצב קולטני הורמונים שמנחים טיפול. מערכות מסורתיות מתייחסות לזה כבעיית תיוג טוקן‑על‑ידי‑טוקן, אך הכותבים הפכו זאת למשימת שאלות ותשובות. לכל משפט בדוח המודל נשאל שאלות פשוטות כמו "מה גודל הגידול?" או "מה שלב הסרטן?" ועליו להשיב בביטוי הרלוונטי או לציין שהשאלה אינה רלוונטית. במשימה זו, CancerLLM השווה או עלה על מודלים רפואיים כלליים גדולים יותר, והשיג דיוק גבוה מאוד תוך שהוא נשאר קומפקטי מספיק לשימוש קליני מעשי.
מרשומות מפוזרות לאבחנה ברורה
המשימה השנייה המרכזית היא יצירת אבחנה. כאן המודל מקבל חתך מציאותי של ביקור אונקולוגי: סיבות להגעה למרפאה, אתר הטיפול, תסמינים, תצפיות אחות, ממצאים פיזיים ותוצאות בדיקות. עליו לייצר את האבחנה הנכונה, כגון סרטן ריאה או לימפומה שאינה הודג׳קין. במבחן רחב, CancerLLM עקף במידה ניכרת מודלים רפואיים ידועים עם עד פי עשר פרמטרים, והגדיל ציון דיוק משולב בלמעלה מתשעת נקודות אחוז בממוצע. במבחן נפרד על קבוצה בלתי תלויה של 2,000 מטופלים שמעולם לא "ראה" קודם לכן, CancerLLM שוב הגיע ראש בראש, מה שמרמז שהוא מסוגל להכליל למטופלים חדשים ולא רק לזכור מקרים קודמים.

בדיקת חוזק בנתוני עולם‑אמיתי מבולגנים
רשומות קליניות אמיתיות אינן נקיות: הן מכילות שגיאות הקלדה, קיצורים ואפילו שגיאות תיוג מדי פעם. הצוות בנה שני מאגרי מבחן מיוחדים כדי לבחון עד כמה המודל שביר או חזק מול רעש כזה. באחד מהם הם הוסיפו בכוונה תשובות שגויות במהלך האימון כדי לדמות נתונים מתויגים באופן שגוי ומצאו ש‑CancerLLM החזיק מעמד לפחות ברמת ביצועים זהה למודלים מקבילים, במיוחד כאשר שיעור השגיאות היה גבוה מאוד. באחר הם הוסיפו שגיאות איות כמו "cnacer" במקום "cancer" בשיעורים שונים. גם CancerLLM וגם מודל השוואה חזק הראו ירידת ביצועים ככל ששיעור השגיאות עלה, מה שמדגיש שגם בינה מלאכותית מתקדמת רגישה לטקסט מבולגן ושכניסת נתונים וטיפול מקדים נקי נותרים קריטיים.
מהירות, יעילות ומגבלות נוכחיות
מכיוון שתקציבי החומרה בבתי חולים מוגבלים, החוקרים השוו גם זמן חישוב ושימוש בזיכרון. מודלים גדולים של 70 מיליארד פרמטרים הצליחו להשיג ביצועים מעט טובים יותר במשימות חילוץ מסוימות אך דרשו כמה פעמים יותר זיכרון וזמני עיבוד ארוכים בהרבה. לעומת זאת, CancerLLM סיפק דיוק מוביל או קרוב למוביל הן בחילוץ והן באבחנה בזמן שהוא רץ על כרטיס גרפי בודד מתקדם עם צרכי זיכרון צנועים. ניתוח השגיאות הראה שהמודל עדיין מתקשה בהבחנות עדינות מאוד, כגון תת‑סוגים דקיקים של סרטן, פרטי סטייג׳ינג מלאים ושימוש כבד בראשי תיבות או בהקלדות שגויות ברשומות — תחומים שבהם נדרשים ניקוי נתונים נוסף ושיפור המודל בעתיד.
מה זה אומר לעתיד של בינה מלאכותית בסרטן
במונחים יומיומיים, CancerLLM דומה לקורא טקסט קומפקטי ומיומן בסרטן שיכול לתמצת במהירות פרטים קריטיים מרשומות רפואיות ולהציע אבחנות סבירות, וכל זאת תוך שמירה על ישימות להפעלה בבתי חולים. הוא לא מחליף אונקולוגים, אבל יכול לחסוך להם זמן, לתמוך במחקרים ולהפחית פרטים שנעלמים בצ’ארטים מורכבים. על ידי פרסום מסגרת המודל ומערכי נתונים סינתטיים, הכותבים מקווים לעודד עבודה נוספת על כלי AI אמינים ויעילים המותאמים לתחומים רפואיים ספציפיים במקום מערכות בגודל אחד שמתאימות לכולם.
ציטוט: Li, M., Zhan, Z., Huang, J. et al. CancerLLM: a large language model in cancer domain. npj Digit. Med. 9, 266 (2026). https://doi.org/10.1038/s41746-026-02441-8
מילות מפתח: אינטליגנציה מלאכותית בסרטן, כריית טקסט קליני, תמיכה באבחון, מודלי שפה רפואיים, אינפורמטיקה באונקולוגיה