Clear Sky Science · he

מודל למידה עמוקה מכויל־חיבורי לאבחון סרטן השד באמצעות נתונים גנטיים

· חזרה לאינדקס

מדוע זה חשוב לחולים ולמשפחות

סרטן השד הוא כיום הגידול המאובחן ביותר בנשים ברחבי העולם, וזיהוי מוקדם יכול להכריע בין חיים למוות. לרופאים יש גישה גוברת למידע הגנטי של אנשים, אך להפיק תשובות ברורות מתוך עשרות אלפי מדידות גנים הוא אתגר עצום. מאמר זה מתאר מודל מחשב חדש שקורא דפוסים גנטיים מורכבים כדי לזהות סרטן השד ולחזות תוצאות בדיוק מרשים, ובכך עשוי לספק לעוסקים ברפואה עוזר חזק להחלטות מוקדמות ומהימנות יותר.

מגנים לאיתותים מוקדמים

לכל גידול בשד יש טביעת אצבע מולקולרית המשוקפת בפעילות אלפי גנים. המחברים שואפים לבנות מערכת שתקרא טביעת אצבע זו ישירות, במקום להסתמך רק על תמונות או על מספר מועט של גנים מוכרים כגון BRCA1 ו‑BRCA2. הם עבדו עם שניים מהמשאבים הציבוריים הגדולים בגנומיקה של סרטן: קבוצת החולים של TCGA בסרטן השד, הכוללת פעילות של 17,814 גנים ב‑590 דגימות, ומחקר METABRIC, שמכיל מידע גנומי וקליני על יותר מ‑1,400 מטופלות. המטרה שלהם היתה שאפתנית: לעצב שיטה שיכולה להתמודד עם שיטפון המידע הזה, למצוא את האותות המוחשיים ביותר, ועדיין לפעול בצורה אמינה בקבוצות מטופלות נפרדות לחלוטין.

Figure 1
Figure 1.

לזקק אלפי גנים לקבוצה מועילה

מבט על כמעט שמונה עשרה אלף גנים בבת אחת מעמיס גם על אלגוריתמים מתקדמים וסיכון לזיהוי רעש חסר משמעות. לכן השתמשו החוקרים במסנן דו‑שלבי כדי לבודד קבוצת גנים קטנה יותר ובעלת מידע אמיתי. תחילה יישמו טכניקה הנקראת Random Forest, השואלת בפועל עצי החלטה רבים אילו גנים חשובים ביותר כדי להבחין בין רקמה סרטנית לנורמלית. שלב זה קיצר את הרשימה ל‑436 גנים מבטיחים. לאחר מכן בחנו כיצד גנים אלה מתנהגים יחד באמצעות כריית חוקים אסוציאטיביים, שיטה שמזהה קבוצות גנים שנוטות להיות פעילות בו‑זמנית בגידולים. שכבת ניתוח נוספת זו זיהתה זוגות ורשתות גנים הקשורות לתהליכים מרכזיים בסרטן כמו חלוקה תאית מהירה, תיקון נזקי DNA ושינויים במארח הרקמתי סביב הגידול. לאחר זיקוק זה נותרו 332 גנים — עדיין עשירים במשמעות ביולוגית אך ניתנים לניהול לניתוחים עמוקים יותר.

רשת עצבית דו‑חלקית שלומדת דפוסים והקשר

עם קבוצת הגנים הממוקדת הזו בידי, הקבוצה בנתה מודל למידה עמוקה היברידי המשלב שני סוגים של רשתות עצביות. חלק אחד, רשת קונבולוציה, סורק לאורך רשימת הגנים כדי לקלוט דפוסים מקומיים — אשכולות גנים שנטויים לעלות או לרדת יחד. החלק השני, רשת זיכרון הכוונת-כיווניות (bidirectional), בוחן את אותן המידע תוך מעקב אחר קשרים לטווח ארוך, ותופס כיצד גנים מרוחקים משפיעים זה על זה לאורך הפרופיל כולו. לפני האימון איזנו המחברים את הנתונים כך שמדגמי סרטן ולא‑סרטן יהיו מיוצגים באופן הוגן והוסיפו כמויות קטנות של רעש מלאכותי, כדי ללמד את המודל לא להטעות על ידי תנודות אקראיות.

כמה טוב המערכת מתפקדת במבחני שדה

כאשר אומן ונבחן על נתוני TCGA, הרשת ההיברידית הבחינה נכון בין דגימות גידול לנורמליות בכ‑97% דיוק והציגה יכולת כמעט מושלמת להפריד בין שתי הקבוצות. חשוב מכך, היא עלתה על תצורות למידה עמוקה פשוטות יותר וכלי למידת מכונה סטנדרטיים כגון רגרסיה לוגיסטית ומכונות וקטור תמיכה, גם כאשר שיטות המתחרות קיבלו את אותם גנים שנבחרו בקפידה. המבחן החזק ביותר היה האם המודל שומר על ביצועים על מאגר נתונים שונה לחלוטין. כאשר יושם על METABRIC, שנאסף בבתי חולים אחרים באמצעות שיטות מעבדה שונות, המערכת שמרה על ביצועים גבוהים: בהריצה הטובה ביותר השיגה דיוק של 99.3% וזיהתה נכון כל מטופלת שמאוחר יותר מתה מסרטן השד — תכונה קריטית אם הכלי מיועד לסמן מקרים בסיכון גבוה.

Figure 2
Figure 2.

מה זה עשוי להגיד על טיפול בעתיד

לקורא שאיננו מומחה, המסקנה היא שמחקר זה מספק מסנן וקורא חכם לנתונים גנטיים שיכול לזהות סרטן השד וסיכונים נלווים בעקביות מרשימה על פני קבוצות מטופלות גדולות. על‑ידי שילוב אסטרטגיית בחירת גנים מושכלת עם רשת עצבית דו‑ענפית, מראים המחברים שמחשבים יכולים לחלץ אותות בעלי משמעות קלינית ממאגרי גנים עצומים, לא רק במחקר יחיד אלא גם בקוהורטים עצמאיים. בעוד שיש צורך בעבודה נוספת כדי לבדוק את הגישה באוכלוסיות מגוונות ולהסביר ביתר פירוט את החלטותיה, השיטה מצביעה על עתיד שבו דגימת דם או רקמה פשוטה תזין מודלים כאלה ותעזור לרופאים לגלות גידולים מוקדם יותר ולמקד טיפול בדיוק רב יותר.

ציטוט: Hesham, F., Abbassy, M.M. & Abdalla, M. Hybrid tuned deep learning model for breast cancer diagnosis using genetic data. Sci Rep 16, 9664 (2026). https://doi.org/10.1038/s41598-026-41643-8

מילות מפתח: גנומיקה של סרטן השד, אבחון בלמידה עמוקה, ביומרקרים של ביטוי גנים, גילוי מוקדם של סרטן, תמיכה בהחלטות קליניות