Clear Sky Science · he
מודל למידה אנליטית מונע-גנים לאבחון מדויק של סרטן השד
מדוע מחקר זה חשוב למטופלות ולמשפחות
סרטן השד הוא כיום הגידול המאובחן בשכיחות הגבוהה ביותר בקרב נשים ברחבי העולם, וחולות שלכאורה סובלות מאותה מחלה יכולות להציג תוצאות שונות מאוד בטווח הארוך. מחקר זה מראה כיצד דפוסים באלפי גנים, בצירוף מערכת בינה מלאכותית שעוצבה בקפידה, יכולים לסייע לרופאים להבחין ביתר אמינות מי חולה בסרטן ומה מידת החומרה — תוך שימוש אך ורק בנתוני מטופלות אמיתיות וקבוצת גנים מצומצמת של מפתחי אות.

ממספר גורמי סיכון לשפת הגנים
הסיכון לסרטן השד מעוצב על ידי גורמים רבים: שינויים גנטיים תורשתיים, הורמונים, משקל גוף, אורח חיים ועוד. לאחר הופעת הסרטן, התנהגותו נשלטת על ידי אילו גנים דלוקים או כבויים בתוך כל גידול. רצף מודרני מסוגל למדוד פעילות בעשרות אלפי גנים בבת אחת, אך להפוך את האוקיינוס הזה של מספרים לתשובות ברורות של כן/לא לאבחון ולתחזית קשה. שיטות מחשוב מסורתיות לעיתים בוחנות גנים אחד-אחד ועלולות להחמיץ את האופן שבו קבוצות גנים פועלות יחד, או שהן מצליחות רק על מערך נתונים אחד ונכשלות כאשר נבדקות במקום אחר.
להדריך מודל בעל מוח כפול לקרוא דפוסי גנים
המחברים בנו מודל למידה עמוקה "היברידי" שפועל מעט כמו שני מוחות מתמחים שעובדים יחד. חלק אחד, בהשראת ניתוח תמונה, סורק רשימת גנים מסודרת כדי לזהות דפוסים מקומיים — אשכולות של גנים שהפעילות המשותפת שלהם מאותתת סרטן. החלק השני מתייחס לאותם גנים כסדרה, ולומד כיצד גנים "מניעים" מוקדמים ו"מורידים" מאוחרים משפיעים זה על זה לאורך הרשימה. על ידי שילוב שתי נקודות המבט האלה, המודל יכול ללכוד גם קשרים בטווח הקצר וגם בטווח הארוך בתוך טביעת האצבע הגנטית של הגידול.
מציאת קבוצת ליבה יציבה של גני אות
במקום להזין את כל 17,815 הגנים הנמדדים למודל, הצוות תיכנן צינור ברירה מחמיר "חף דליפה" כדי לבחור רק את המידע המועיל ביותר. באמצעות מדד סטנדרטי של מתאם בתוך לולאות בדיקות חוזרות, דירגו את הגנים שוב ושוב לפי כמה חזק פעולתם התכתבה עם מצב הסרטן. לאחר מכן שמרו רק את הגנים שעלו בעקביות לשורה הראשונה בכל חלוקי האימון, מה שהניב חתימה יציבה של 236 גנים. החוקרים גם מיפו כיצד גנים אלה מתקשרים זה עם זה, והראו שרבים מהם יוצרים רשתות מחוברות היטב הקשורות לצמיחת הגידול, מטבוליזם, חיסון וסביבת הרקמה — עדות לכך שהקבוצה הנבחרת משקפת ביולוגיה במציאות, ולא רעש אקראי.

בדיקת המודל במבחן
המערכת ההיברידית אומנה וכוונה על דגימות סרטן השד ממאגר The Cancer Genome Atlas ואז נבחנה מול מערך נתונים נפרד לחלוטין הידוע כ-METABRIC. כדי להתמודד עם העובדה כי דגימות סרטניות עולות בהרבה על דגימות תקינות, המחברים לא יצרו נתונים מלאכותיים; במקום זאת, הם כיוונו את מידת ה"דאגה" של המודל לטעויות במחלקה הנדירה יותר. לאחר חיפוש אוטומטי של ההגדרות הטובות ביותר, המודל הגיע לציונים קרובים למושלם על המערך המרכזי שלו, איתר כמעט את כל מקרי הסרטן ולא ייצר כמעט התראות שווא. מה שחשוב — הביצועים נשמרו גבוהים ויציבים גם כאשר המודל הוחל על קבוצת METABRIC החיצונית, מה שמרמז שהגישה יכולה להכליל מעבר למחקר או בית חולים אחד.
מה זה אומר לטיפול בעתיד
במילים פשוטות, עבודה זו מספקת מערכת בינה מלאכותית מעודנת ומורכבת משני חלקים שקוראת קוד גנטי מצומצם של 236 גנים כדי להבחין בין דגימות שד סרטניות לבלתי-סרטניות בדיוק ובעקביות מרשימים, אפילו בתנאים רועשים. בעוד שהמחקר הנוכחי בוחן רק פעילות גנים ומשתמש בנתוני עבר של מטופלות, השיטות שלו מטילות יסוד לכלים עתידיים שיכולים לשלב סוגי נתונים מרובים — כגון תמונות רקמה ושכבות מולקולריות נוספות — ולספק הסברים ברורים באילו גנים מושתתת כל חיזוי. עם אימות נוסף במחקרים קליניים פרוספקטיביים, מערכת כזו יכולה להפוך לעמוד שדרה אוניברסלי לאבחון מדויק של סרטן השד, ולעזור לרופאים להתאים טיפול על פי ה"חתימה" הגנטית של כל גידול.
ציטוט: Hesham, F., Abbassy, M.M. & Abdalla, M. Gene driven analytical learning model for accurate breast cancer diagnosis. Sci Rep 16, 8155 (2026). https://doi.org/10.1038/s41598-026-39430-6
מילות מפתח: אבחון סרטן השד, ביטוי גנים, למידה עמוקה, CNN-BiLSTM, אונקולוגיה מדויקת