Clear Sky Science · he

שיפור ביצועי לא-מומחים בפרוטוקול MRI של מערכת שריר-שלד באמצעות מודל שפה גדול

2026-03-06 · חזרה לאינדקס

סריקות חכמות למפרקים כואבים

כאשר כואב הברך, הכתף או הגב, רופאים לעתים קרובות מזמינים MRI כדי לבחון את השרירים, המפרקים והעצמות מבפנים. אבל קבלת MRI מועיל אינה פשוטה כמו לחיצה על כפתור. טכנאים ורופאים מתחילים חייבים לבחור מתוך עשרות אפשרויות סריקה, וטעות יכולה לגרום לתמונות מטושטשות או חלקיות, לבזבוז זמן ולצורך בחזרה למכונה. מחקר זה שואל שאלה עכשווית: האם כלי שפה מתקדמים מבוססי בינה מלאכותית יכולים לשבת לצדם של לא‑מומחים ולעזור להם לבחור הגדרות MRI של מערכת שריר‑שלד טוב יותר בפעם הראשונה?

למה בחירת ה‑MRI הנכון חשובה

MRI של מערכת שריר‑שלד מכסה מגוון עצום של חלקי גוף — מהאצבעות ועד עמוד השדרה — ומגוון בעיות שונות, כגון פגיעות ספורט, דלקת מפרקים וזיהומים. כל מקרה עשוי לדרוש שילוב שונה של זוויות סריקה, אזורי כיסוי וטריקים להפחתת ארטיפקטים ממתכות של שתלים. לכן בתי חולים שומרים ספריות גדולות של פרוטוקולים, לעתים מאות וריאציות, שהתפתחו במשך שנים של ניסוי וטעייה מקומיים. ככל העומס על הדימות גדל והרדיולוגים המומחים נדחסים, יותר מעבודת 'תכנון הפרוטוקול' מועברים לרזידנטים ולטכנאים. שגיאות עלולות להביא לחזרת מטופלים לסריקות חזור, להפרעות בלוח ולדחיות באבחון.

להכניס עוזר בינה מלאכותית לחדר הבקרה

החוקרים בחנו מודל שפה גדול מסחרי (GPT‑4o) כעוזר ולא כתחליף לצוות האנושי. הם אספו תחילה יותר מ‑12,000 הזמנות MRI של מערכת שריר‑שלד מבית חולים אחד כדי לעצב הנחיית פרומפט מפורטת למודל. עבור כל מקרה, המודל קיבל מידע ממויין ולא מזוהה שנלקח מהרשומה הרפואית האלקטרונית: סוג המבחן שהוזמן, הערות הרופא, דוחות הדימות האחרונים וההערות הקליניות הרלוונטיות. בתהליך איטרטיבי של שבועיים עד הכנתו, הצוות זימן פרומפט ארוך אחיד כך שהבינה המלאכותית תנפיק גיליון עבודה מובנה: שם הפרוטוקול המומלץ, האזור המדויק לסריקה, האם להשתמש בהפחתת ארטיפקטים ממתכת, כיצד לדכא אותות שומן, איזה סליל להשתמש ועוד פרטים. הם הטמיעו כללים בתוך הפרומפט כדי למזער השערות ולהשאיר את תגובות ה‑AI עקביות.

לבדוק לא-מומחים וה‑AI במבחן

כדי לבדוק האם ה‑AI אכן סייע לאנשים, הצוות הרכיב סט מבחן נפרד של 107 הזמנות MRI חדשות. שלושה רזידנטים ברדיולוגיה ושלושה טכנאים, כולם עם פחות משנה של ניסיון, התבקשו למלא גיליונות פרוטוקול לכל מקרה פעמיים: פעם אחת בהתבסס על שיקול דעתם בלבד ופעם שנייה בסיוע ה‑AI. עיצוב קרוסאובר ורווח של שישה חודשים בין המושבים סייעו למנוע השפעות זיכרון פשוטות. שני רדיולוגים מומחים למערכת שריר‑שלד, שעבדו על פי פרוטוקולים שהם הגדירו כתקן זהב, דירגו כל גיליון על סולם "מעבר קליני" בעל ארבע נקודות, המשקף השלכות בעולם האמיתי — מתחילת כישלון מוחלט שדורש סריקה חוזרת מלאה ועד התאמה מצוינת.

מה השתנה כשה‑AI הצטרף לצוות

בעזרת ה‑AI ציינו הממוצעים עלייה בנקודות גם אצל הרזידנטים וגם אצל הטכנאים, והשיפור היה מובהק סטטיסטית. ההבדל המשמעותי ביותר לא היה בשינויים קטנים בציונים, אלא בצמצום החלק של פרוטוקולים שנחשבו עשויים להצריך חזרה חלקית או מלאה של ה‑MRI. אצל הרזידנטים, מקרים מסוכנים אלה ירדו בכ‑12% בקירוב; אצל הטכנאים, בכ‑8% בקירוב. במחלקה עמוסה המטפלת בכ‑40 מבחנים כאלה ביום, זה יכול להתקזז לכמה סריקות בעייתיות פחות מדי יום. הפלטים של ה‑AI היו די יציבים: כאשר אותו מקרה הוזן חמש פעמים, הציונים שלו היו תואמים במידה טובה, ובמעל למחצית המקרים הפיק תוכנית מצוינת בכל ריצה. כשטעה, הבעיות בדרך כלל נגעו לבחירות טכניות עדינות, כגון שיטות מדויקות לדיכוי שומן או מיקוד מדויק, ובוחנים אנושיים יכלו לעתים קרובות לזהות את הבעיות מתוך הנימוקים שצירף ה‑AI.

כיצד אנשים השתמשו וביזו מידה ניצלו יתרונות

סקרים של הצוות המשתתף חשפו כיצד בני אדם בפועל תרגלו אינטראקציה עם הכלי. הם מצאו שההערות הנלוות של ה‑AI — לגבי היכן להתמקד בסריקה, איזה סליל להשתמש ולמה פרוטוקול מסוים הגיוני — היו בעלות ערך מיוחד. משתתפים רבים זכרו מאוחר יותר והשתמשו מחדש ברעיונות מה‑AI גם כשעבדו בלעדיו, מה שמצביע על תועלת הדרכתית. יחד עם זאת, המחקר חשף עקבות של הטיית אוטומציה והטיית האישור: המשתתפים נטו להישען על ה‑AI יותר כאשר הוא תאם את אינסטינקטם הראשוני, ולעתים עקבו אחריו גם כשהציון העצמתי שלו היה נמוך. עם זאת, באופן כללי הביצועים כמעט ולא הורעו בעזרת ה‑AI ורק חלק קטן מהמקרים ניזוקו מהצעותיו.

מה זה אומר למטופלים ולקליניקות

למטופל השוכב במכונת ה‑MRI, פרטי בחירת הפרוטוקול מאחורי הקלעים בלתי נראים. ובכל זאת מחקר זה מציע שמודל שפה מבוסס בעיצוב מוקפד, המופעל דרך ממשק צ'אט שגרתי, יכול לשפר באופן שקט את איכות תכנון ה‑MRI של מערכת שריר‑שלד על ידי עובדים זוטרים ולהפחית את מספר הסריקות שצריך לחזור עליהן. המערכת אינה תחליף לרדיולוגים מומחים וביצועיה תלוים בכללים מקומיים ובפיקוח מתחשב. אך כעוזר מעשי המסייע ללא‑מומחים לבחור הגדרות טובות יותר בפעם הראשונה, היא מציעה הצצה לאופן שבו ה‑AI יכול להפוך הדמיה מתקדמת ליעילה יותר וידידותית יותר למטופל.

ציטוט: Lee, S., Choi, H., Chun, K.S. et al. Improving non-expert performance in musculoskeletal MRI protocoling through a large language model. Sci Rep 16, 12423 (2026). https://doi.org/10.1038/s41598-026-41898-1

מילות מפתח: MRI של מערכת שריר-שלד, זרימת עבודה ברדיולוגיה, מודלים גדולים של שפה, תמיכה בקבלת החלטות קליניות, בינה מלאכותית בהדמיה רפואית