Clear Sky Science · he

מערך נתוני CT עם מדידות RECIST ומסכות סגמנטציה מקיפות לגידולים וצמתיות לימפה

· חזרה לאינדקס

מדוע המשאב הזה בתחום הדמיית הסרטן חשוב

טיפול בסרטן תלוי יותר ויותר בהדמיה רפואית כדי להחליט האם טיפולים פועלים. עם זאת, המדידות המדוקדקות שמבצעים הרופאים פר פרוסת CT גוזלות זמן ועלולות להשתנות בין מומחה למומחה. מאמר זה מציג אוסף חדש ונגיש של סריקות CT של חולי סרטן, שבו גידולים וצמתיות לימפה סומנו ונמדדו בקפידה בהתאם לכללי קליניות נפוצים. המערך נועד לסייע לחוקרים לבנות ולבחון תוכנות מחשב שיום אחד יכולות להחליף חלק ניכר מהעבודה המשעממת הזו ולהפוך את מעקב הטיפול בסרטן למהיר ואחיד יותר ברחבי העולם.

כיצד רופאים עוקבים כיום אחרי גידולים

כדי להעריך האם טיפול בסרטן עוזר, רדיולוגים עוקבים לעתים קרובות אחר תקן שנקרא RECIST 1.1. בפועל זה אומר שהם בוחרים מספר גידולים "מטרה" בסריקות CT של המטופל ורושמים את הקוטר הארוך הנראה של כל אחד במילימטרים. עם הזמן הם משווים את סכום הקטרים הללו לסריקות קודמות כדי להחליט אם המחלה הצטמצמה, נותרה יציבה או גדלה. גישה זו הביאה סדר נחוץ לניסויים קליניים, אך יש לה חסרונות: היא תלויה מאוד בבחירת הגידולים על ידי הרופא, מסתמכת על מדידות חד־ממדיות במקום על מימד תלת‑ממדי אמיתי, ובדרך כלל אורכת יותר מ־10 דקות לכל מטופל בכל הערכה. ככל שמקרי הסרטן עולים ברחבי העולם, מגבלות אלה יוצקות לחץ ממשי על שירותי הרדיולוגיה.

Figure 1
Figure 1.

מה מכיל מערך הנתונים החדש של CT

המחברים אספו סריקות CT מ־22 מבוגרים שטופלו למגוון סוגי סרטן בבית החולים הקליני של אוניברסיטת צ׳ילה, כולל סרטן ריאות, כבד, קולורקטלי, שד, שחלות, קיבה, כיס מרה, שלפוחית ומלנומה. מתוך 58 סדרות סריקות בית החזה והבטן שנעשו בין 2017 ל־2023, הם זיהו כל גידול מוצק או צמתית לימפה מוגדלת שהייתה גדולה די הצורך למדידה. בסך הכל סומנו ידנית 1,246 גרורות בודדות: 1,148 גרורות (גידולים שהתפשטו), 93 צמתיות לימפה מוגדלות, ו־5 גידולים ראשוניים. עבור 82 מהלזיות אלה הם כללו גם את מדידות RECIST הרשמיות שנרשמו בדוחות הקליניים, מה שמאפשר השוואה צמודה בין הפרקטיקה השגרתית והשיטות האוטומטיות.

כיצד מומחים ובינה מלאכותית עבדו יחד

הכנת סימונים מפורטים כאלה בדרך כלל הייתה איטית מדי, לכן הצוות השתמש באסטרטגיית "אדם־בלולאה". רדיולוגים מנוסים ומתמחים סרטטו תיבות תלת־ממדיות גסות סביב גידולים חשודים, ומודל סגמנטציה חזק בשם MedSAM הציע גבולות ראשוניים. המתמחים אז תיקנו את הגבולות הללו, ורדיולוגים בכירים ערכו ביקורת סופית. לאחר כל אצווה של סריקות הושכל מחדש מודל ה‑AI על הסימונים המשופרים ושימש לסיוע באצווה הבאה. בכל מחזור ביצועיו התקרבו לאלה שמומחי אדם היו מקבלים, מה שהפחית את המאמץ הנדרש לתיקונים נוספים תוך שמירה על דיוק.

מה מגלים הנתונים על גידולים

מכיוון שכל נגע בסריקות סומן בתלת־ממד, יכלו המחברים לחקור את גדליו וצפיפויותיו בפירוט. רוב הגידולים היו בריאות ובכבד. גידולי ריאה נטו להיות קטנים בנפח אך לעתים קרובות בעלי קטרים יחסית ארוכים, בעוד שצמתיות לימפה הראו נפחים גדולים יותר אך קטרים ראשיים קצרים במידה מסוימת ביחס לגידולי כבד. הצוות גם בדק כיצד האזורים האלה נראים בהירים או חשוכים בסריקות CT, תכונה שקשורה לצפיפות הרקמה. גידולי ריאה, המקיפים באוויר, הראו דפוסי עוצמה שונים מאוד מגידולי כבד וצמתיות לימפה, מה שמעיד שתכונות מספריות פשוטות מתמונות CT עשויות לסייע להבחין בין סוגי נגעים. חשוב לציין שהמחקר אישר קשר חזק בין הקוטר הארוך של נגע ונפחו התלת־ממדי האמיתי, ותמך ברעיון שכללים מבוססי קוטר כגון RECIST יכולים לשמש תחליף פרקטי למדידות נפחיות מלאות when applied carefully.

Figure 2
Figure 2.

הצבת מערך הנתונים למבחן עם למידה עמוקה

כדי להדגים כיצד ניתן להשתמש במערך הנתונים, החוקרים אימנו ושכללו שתי משפחות של מערכות למידה עמוקה. ראשית, הם כיווננו את MedSAM לסגמנטציה אוטומטית של גידולים מתוך תיבות ג_bbox פשוטות, והשיגו ציוני חפיפה מול סימוני המומחים שנעו בטווח שדווח על מערכי נתונים בינלאומיים גדולים בהרבה. שנית, הם התאימו מסגרת נפוצה בשם nnUNet, החל ממודלים שאומן על אתגרים עולמיים בהדמיית ריאה וכבד ואז הכווננו אותם על הנתונים הצ׳יליאניים החדשים. לאחר הכיוונון, המערכות התאימו או עלו על ביצועיהן המקוריים, במיוחד עבור גידולי ריאה, אף על פי שקבוצת המטופלים הייתה יחסית קטנה. הדבר מראה שנתונים מקומיים מטופחים בקפידה יכולים לשפר משמעותית את האמינות של כלי AI בסביבה בית חולים ספציפית.

מה המשמעות לכך בעתיד של טיפול בסרטן

בעבור הלא מומחים, המסר המרכזי הוא שמערך נתונים זה הוא כלי מניע, לא מוצר אבחוני בפני עצמו. על ידי שיתוף פתוח של סריקות CT שבהן כל גידול וצמתית לימפה נראים וסומנו, ובמקרים רבים נמדדו במדויק, המחברים מספקים שדה אימונים ריאלי לאלגוריתמים שמטרתם לאוטומציה של מעקב גידול. כלים כאלה עשויים לסייע לרדיולוגים להשקיע פחות זמן במדידות ידניות ויותר זמן בשיפוטים מורכבים, תוך צמצום השונות בין קוראים. מאחר שהנתונים מגיעים מבית חולים באמריקה הלטינית ומשוחררים תחת רישיון משתף, הם גם תורמים לכך ש‑AI רפואי עתידי ייבדק על מטופלים מגוונים יותר, ומשפרים את הסיכוי שמעקב אוטומטי אחר סרטן יעבוד באופן אמין עבור אנשים ברחבי העולם.

ציטוט: Rojas-Pizarro, R., Vásquez-Venegas, C., Pereira, G. et al. A CT Dataset with RECIST Measurements and Comprehensive Segmentation Masks for Tumors and Lymph Nodes. Sci Data 13, 270 (2026). https://doi.org/10.1038/s41597-026-06597-6

מילות מפתח: הדמיית סרטן, סריקות CT, סגמנטציה של גידול, RECIST, מערכי נתונים ל-AI רפואי