Clear Sky Science · he
מודל יצירת תיאורים בינה מלאכותית לפתולוגיה דיגיטלית של אדנוקרצינומה בבדיקת היסטופתולוגיה אנדוסקופית באמצעות מנגנוני קשב רב‑מקטעים
מדוע חשוב להפוך פרוסים למילים
כשיש חשד לסרטן בקיבה, נלקחות דגימות זעירות מרירית הקיבה ונבדקות במיקרוסקופ. פירוש הפרוסים הללו הוא משימה מיומנת וגוזלת זמן עבור הפתולוגים, והדוח הכתוב שהם מייצרים מנווט כל החלטת טיפול מאוחרת. מחקר זה מציג מערכת בינה מלאכותית שעושה דבר מפתיע בעדינות אנושית: היא מסתכלת על תמונות דיגיטליות של פרוסות ביופסיה קיבתיות וכותבת אוטומטית תיאורים קצרים ומובנים בדומה לדוח פתולוגי.
מפרוסה זכוכית לעוזר דיגיטלי
אדנוקרצינומה קיבתית, צורה שכיחה ומַסכֶּנֶת חיים של סרטן הקיבה, מאובחנת ומדורגת כיום על ידי פתולוגים הלומדים חזותית דגימות ביופסיה. בעשור האחרון התחילו בתי חולים רבים לסרוק פרוסות זכוכית לתמונות דיגיטליות בעלות גודל עצום, ובכך נפתח פתח לכלים מבוססי בינה מלאכותית שיכולים לסייע באבחון. מערכות מוקדמות התמקדו בעיקר בשאלות כן‑או‑לא, כגון האם קיים סרטן, או בהענקת קטגוריה. לעומת זאת, דוחות פתולוגיים אמיתיים הם נרטיביים: הם מתארים צורות תאים, דפוסי רקמה ועד כמה הגידול נראה אגרסיבי. רק מספר ניסיונות מחקריים ניסו לייצר תיאורים תיאורטיים ישירות מתמונות של פרוסות שלמות, ורבים מהם תלויים בתוויות נוספות שמציינות תת‑סוגים מוגדרים מראש — תוויות יקרות ולעתים לא זמינות.

דרך חדשה עבור ה-AI לקרוא הרבה חתיכות קטנות
המחברים מציגים מודל תיוג בשם MIAC (Multi‑instance Attention Captioning) שתוכנן במיוחד לפרוסות ביופסיה של אדנוקרצינומה קיבתית. פרוסה דיגיטלית אחת גדולה מדי כדי להזין אותה למודל בבת אחת, לכן היא מחולקת לריבוי תמונות מרובעות קטנות, או טלאים. MIAC משתמש בגישה הידועה כלמידה רב‑מקטעית: במקום להתייחס לטלאים אלה כרצף מסודר, הוא רואה בהם קבוצה, ומאפשר למספר וסידור הטלאים להשתנות מפרוסה לפרוסה כפי שקורה בשגרה. רשת תמונה חזקה מפיקה תחילה תכונות חזותיות מכל טלאי. אז מנגנון קשב עצמי, שנבנה ללא מידע על מיקום, לומד באיזו עוצמה כל טלאי צריך להשפיע על הסיכום הסופי. המודל משלב אותות אלה לייצוג קומפקטי אחד של כל הפרוסה, אשר מזין אחר כך מודול שפה שמייצר כיתוב דיאגנוסטי באורך משפט, מילה אחר מילה.
אימון על דוחות אמיתיים, מבחן בבית חולים אחר
כדי ללמד את MIAC, החוקרים השתמשו במאגר ציבורי בשם PatchGastricADC22, הכולל כמעט אלף פרוסות ביופסיה סרוקות מבית חולים יפני. כל פרוסה צומדה למשפט דיאגנוסטי קצר שנלקח מהדוח הפתולוגי המקורי והומר לטרמינולוגיה סטנדרטית. הפרוסות חולקו למאות טלאים, והמודל הוכשר לייצר את הכיתוב המקורי כאשר ניתן לו תת‑קבוצה של טלאים אלה. הביצועים נמדדו בעזרת מדדי השוואת שפה סטנדרטיים שמעריכים עד כמה התיאורים שמייצרת ה‑AI תואמים לטקסט המומחה. MIAC עלה על שיטה קודמת שהיתה מצב‑האומנות בכל המדדים, במיוחד כשהורשה לראות יותר טלאים לפרוסה במהלך האימון, מה שמרמז שהוא היה טוב יותר בלכידת התמונה ברמת הפרוסה מתוך נקודות מבט מקומיות מפוזרות.

התמודדויות עם הבדלים בין בתי חולים
שאלה מרכזית עבור כל מערכת בינה מלאכותית רפואית היא האם היא עדיין עובדת כשהנתונים מגיעים ממקור חדש. לכן הצוות בדק את MIAC על מערך עצמאי של פרוסות ביופסיה קיבתיות שנאספו בבית חולים שונה, עם כיתובים שנכתבו על ידי פתולוג אחר. התמונות הללו שונות בצבען בגלל נהלי צביעה וסריקה מקומיים — בעיה שכיחה שיכולה להכשיל מודלים מבוססי תמונה. החוקרים השתמשו בטכניקת נירמול צבע נפוצה, שמכוונת את גווני הצביעה כך שיתאמו יותר לאלה של פרוסות האימון. גם בלי כוונון נוסף, MIAC הפיק כיתובים בעלי משמעות קלינית על מאגר חיצוני זה, וביצועיו השתפרו כאשר הוחל נירמול צבע וכאשר נמדדו יותר טלאים מכל פרוסה.
מה זה יכול משמעותית עבור טיפול בחולה
MIAC אינו מיועד להחליף פתולוגים; במקום זאת מטרתו לנסח תיאורים תמציתיים וממוסדים שהמומחים יוכלו לסקור ולערוך במהירות. במרפאות עמוסות או באזורים עם גישה מוגבלת למומחים, כלי כזה עשוי לקצר את זמן הדיווח, להקטין שונות בניסוח ולסמן מקרים עם דפוסים מורכבים לבחינה מדוקדקת יותר. המחקר גם מוסיף אור על המגבלות הנוכחיות: הביצועים עדיין יורדים כאשר המודל מתמודד עם פרוסות ממוסדות חדשים או עם דפוסי רקמה בלתי שגרתיים, וניקוד שפה אוטומטי לא מקיף את השימוש הקליני. המחברים טוענים כי יהיה צורך במאגרי נתונים עשירים יותר ברמת מרכזים מרובים, בדרכים חכמות יותר לבחור אילו טלאים לבדוק, ובמשוב ישיר מהפתולוגים לפני שמערכות ייצור‑כיתובים כאלה ישולבו בבטחה בשגרות האבחון היומיומיות.
ציטוט: Lee, Y., Bai, K., Kim, Y. et al. AI caption generation model for digital pathology of adenocarcinoma in endoscopic histopathology using multi-instance attention mechanisms. Sci Rep 16, 13244 (2026). https://doi.org/10.1038/s41598-026-37455-5
מילות מפתח: סרטן קיבה, פתולוגיה דיגיטלית, בינה מלאכותית רפואית, יצירת תיאורים לתמונות, היסטופתולוגיה