Clear Sky Science · he

PETWB-REP: מאגר נתונים של PET/CT לכל הגוף עבור מספר סוגי סרטן עם דוחות רדיולוגיים מתאימים

· חזרה לאינדקס

מדוע המשאב החדש הזה לדימות סרטן חשוב

רופאי סרטן מסתמכים יותר ויותר על בדיקות מתקדמות וכלים ממוחשבים כדי להבין כיצד גידולים מתנהגים בכל רחבי הגוף. אך מערכות בינה מלאכותית חזקות זקוקות לאוספים עצומים ומסודרים של סריקות אמיתיות של מטופלים כדי ללמוד מהם, ואוספים כאלה נדירים למדי וקשה לשתף אותם בצורה בטוחה. מאמר זה מציג את PETWB-REP, אוסף ציבורי חדש של סריקות לכל הגוף במחלות סרטן ודוחות רופאים מתאימים, שמטרתו להאיץ פיתוח כלי אבחון טובים יותר ולתמוך במחקר מדויק יותר ברחבי העולם.

Figure 1
Figure 1.

חלון אל כל הגוף

פרויקט PETWB-REP מתמקד בסוג בדיקה הנקרא FDG PET/CT, שמשלב שתי נקודות מבט על הגוף בו־זמנית. חלק ה‑CT מציג אנטומיה מפורטת, כמו עצמות ואיברים, בעוד שחלק ה‑PET מדגיש אזורים שמשתמשים בכמות רבה של סוכר, לעיתים סמן לפעילות סרטנית. באמצעות מיזוג התמונות הרופאים יכולים לראות לא רק היכן הגידולים ממוקמים, אלא גם עד כמה הם פעילים. מאגר הנתונים החדש אוסף סריקות לכל הגוף מ‑490 אנשים עם סוגי סרטן שונים, כולל ריאה, כבד, שד, ערמונית, שחלה ואחרים, מה שהופך אותו לנרחב יותר מהרבה אוספים קודמים שהתמקדו בסוג גידול יחיד.

מבדיקה קלינית לנתונים מוכנים‑מחקר

כל הסריקות נאספו במרכז דימות גדול בשנחאי בין השנים 2021 ל‑2024 במהלך טיפול שגרתי, תחת פיקוח ועדת אתיקה. המטופלים צמו לפני הסריקה, קיבלו הזרקה מדויקת של סוכר רדיואקטיבי, ולאחר מכן נחו כדי לאפשר למטביע להתפזר בגוף. כל סריקה כיסתה את הגוף מבסיס הגולגולת ועד חצי הירך, לפי פרוטוקול סטנדרטי כך שניתן יהיה להשוות בין המטופלים. בנוסף לתמונות עצמם, הצוות תיעד מידע בסיסי כגון גיל, מין, סוג הסרטן ופרטי ביצוע הסריקות, ואחסן את הכל במבנה עקבי שתוכנן לשיתוף תמונות רפואיות.

שימור פרטיות תוך שמירה על פרטים רפואיים

הפיכת סריקות קליניות למשאב ציבורי בטוח דרשה תהליך קפדני של הסרת מידע אישי תוך שימור פרטים בעלי ערך רפואי. החוקרים מחקו תחילה שמות, מזהים ומזהים אחרים מקבצי התמונה והחליפו אותם בקודי מחקר. לאחר מכן השתמשו בכלי ייעודי כדי להסיר דיגיטלית מאפייני פנים מתמונות ה‑CT כדי שלא ניתן יהיה לזהות את המטופלים, תוך שמירה על אנטומיית הצוואר והגוף לניתוח. שני חוקרים בדקו ידנית את הסריקות והטקסט כדי לוודא שלא נשאר מידע מזהה. התוצאה היא סט של תמונות ודוחות ששומרים על דפוסי גידול ומבנה איברים אך אינם חושפים עוד את זהות המטופלים.

גשר בין תמונות למילים

מאפיין בולט של PETWB-REP הוא שכל סריקה מלווה בדוח רדיולוגי מלא שנכתב על ידי רופאי רדיונוקליאריים מנוסים. דוחות אלה מתארים מה רואים הרופאים באזורים שונים של הגוף, מציינים את הגודל וההתנהגות של מוקדים חשודים, ומסתיימים עם רושם כללי. כדי לפתוח את מאגר הנתונים לקהל עולמי, הדוחות הסיניים המקוריים תורגמו לאנגלית באמצעות תרגום מכונה ולאחר מכן תוקנו בקפדנות על‑ידי מומחה דו‑לשוני, כששתי השפות שוחררו זו לצד זו. צימוד עשיר זה של תמונות וטקסט עושה את המאגר לאידיאלי לאימון מערכות מחשב שיכולות לקשר דפוסים בתמונות לאופן שבו הרופאים מתארים ומפרשים אותם.

Figure 2
Figure 2.

כיצד חוקרים יכולים להשתמש במשאב זה

מאגר הנתונים הסופי מאורגן לקטגוריות של סריקות "גולמיות" וגרסאות מעובדות שהקלות על מיחשוב. הצוות המיר את הנתונים לפורמט מחקר נפוץ, כוון בהירות וניגודיות של תמונות, יישר בין תצוגות ה‑PET וה‑CT, ויצר טבלת אמה המסכמת כל מקרה. הם גם ערכו בדיקות איכות כדי לוודא שלכל מטופל יש סריקות ודוחות תואמים וכי התמונות חפות מפגמים משמעותיים. על בסיס זה, חוקרים יכולים לבנות ולבדוק כלים לזיהוי ואילוח אוטומטי של גידולים, לשלב מידע מתמונה וטקסט כדי לחזות תוצאות, או להפיק טיוטות דוחות מתוך סריקות. למרות שהנתונים מגיעים ממרכז יחיד ותמהיל סוגי הסרטן משקף את הפרקטיקה המקומית, הגודל, המגוון וההכנה המדוקדקת של PETWB-REP הופכים אותו לנקודת התחלה חדשה וחשובה למחקרים רפואיים ולמחקר בבינה מלאכותית.

ציטוט: Xue, L., Feng, G., Zhang, W. et al. PETWB-REP: A Multi-Cancer Whole-Body FDG PET/CT Dataset with Corresponding Radiology Reports. Sci Data 13, 675 (2026). https://doi.org/10.1038/s41597-026-07058-w

מילות מפתח: דימות PET/CT, מאגר נתונים רב-סרטני, דוחות רדיולוגיים, בינה מלאכותית רפואית, דימות מולטימודלי