Clear Sky Science · he
ניצול ייצוגים שנלמדו ולמידת משימות מרובות לגילוי אתרי מתילציה על ליזין
מדוע סימנים חלבוניים זעירים חשובים לבריאות
בתוך כל תא, חלבונים מותאמים כל הזמן עם תגים כימיים קטנים היכולים להדליק או לכבות את פעילותם. אחד התגים הללו, שנקרא מתילציה על ליזין, מסייע לשלוט באופן שבו הגנים שלנו פועלים ומקושר ביתר שאת לסרטן ולמחלות אחרות. עם זאת, גילוי המיקומים המדויקים של התגים האלה על אלפי חלבונים במעבדה הוא איטי ויקר. עבודה זו מציגה את MethylSight 2.0, מודל ממוחשב חזק הסורק רצפי חלבון ומנבא אילו ליזינים סבירים להיות מתילטיים, וכך עוזר למדענים לגלות ביולוגיה חדשה ומטרות תרופתיות פוטנציאליות הרבה יותר מהר.
מתגים נסתרים על חלבונים
חלבונים מורכבים משרשרות של חומצות אמינו, וליזין הוא אחד מהמקומות המרכזיים שבהם התאים יכולים להוסיף תגים כימיים. מתילציה על ליזין ידועה כבר כמשפיעה על האופן שבו ה-DNA נארז בגרעין, ועיצוב מי מהם יידלקו או יכובו. אך אירועי מתילציה רבים על ליזין מתרחשים גם על חלבונים שאינם היסטונים — החלקים שמרכיבים את שלד התא, מפעילים את המנועים שלו ומשדרים אותות. כמה אנזימים שממקמים את התגים הללו פעילים יתר על המידה בסוגי סרטן, מה שהופך אותם למטרות תרופה מושכות. האתגר הוא שגילוי ניסויי של מתילציה על כל הפרוטאום האנושי דורש משאבים עצומים של זמן, כסף וציוד מיוחד, ולכן חוקרים פונים לכלי חיזוי כדי למקד את עבודת המעבדה שלהם באתרי המטרה המבטיחים ביותר.

לימוד המחשבים את שפת החלבונים
המחברים בונים על ההתקדמות האחרונה ב"מודלים של שפת חלבון", אלגוריתמים שאומנו על מיליונים עד מיליארדי רצפי חלבון ולומדים דפוסים המקשרים בין רצף למבנה ולתפקוד. מודלים אלה ממירים כל חומצת אמינו בחלבון לתיאור מספרי עשיר הלוכד את הסביבה הכימית וההקשר התלת־ממדי שלה. באמצעות ייצוגים שנלמדו אלה עבור כל ליזין ושכניו, הצוות בחן מספר עיצובים של רשתות עצביות, כולל פרספטרון רב־שכבתי פשוט יותר ואדריכלות טרנספורמר מתקדמת יותר. הם קיבלו בקפידה נתוני אימון ממאגרי מידע ציבוריים, בחרו אתרי מתילציה בעלי ביטחון גבוה ובנו דוגמאות שליליות ריאליסטיות, תוך הימנעות מרדנדנציה שעשויה לנפח את הביצועים.
למידה מסימנים כימיים אחרים
התאים אינם מקשטים ליזין בבדידות. אותו מיקום יכול להיות מנותב גם באצטילציה, יוביקוויטינציה או סומוילציה, ותגים אלה יכולים להתחרות או לשתף פעולה, להשפיע על איזה שינוי ינצח. החוקרים הניחו שדפוסים הקשורים לתגים אחרים אלה עשויים לסייע למודל לזהות מתילציה טוב יותר. הם הפכו את הבעיה להגדרת למידה מרובת משימות, ואימנו רשת מבוססת טרנספורמר יחידה לחזות ארבעה סוגי שינויי ליזין בו־זמנית, תוך שיתוף רוב הפרמטרים הפנימיים שלה. הגדרה זו מאפשרת לידע שנצבר מסוג אחד של שינוי לחזק את החיזויים לאחרים, במיוחד עבור מתילציה, שלגביה קיימים פחות דוגמאות ידועות.
חיזויים טובים יותר ואישור מעשי
מודל הטרנספורמר מרובת המשימות, הקרוי MethylSight 2.0, עלה על כלים קודמים בהפרש ניכר בערכת מבחן עצמאית, כשהוא מכפיל ואף יותר מדי של מדד מרכזי של דיוק לעומת שיטות ישנות. באמצעות הערכות ריאליסטיות לגבי כמה נדירה המתילציה בתאים אמיתיים, המחברים מעריכים שהמודל שומר על דיוק שימושי גם בתנאים מאתגרים. לאחר מכן הם החילו את MethylSight 2.0 על כל הפרוטאום האנושי הסקור (reviewed) ובשימוש בספי זהירות חזו יותר מ-60,000 ליזינים סבירים להיות מתילטיים. מתוכם בחרו 100 אתרים כמועמדים לניסויי ספקטרומטריית מסה ממוקדת וזיהו מתילציה ב-68 מהם, מה שמרמז שחיזויי המודל מתורגמים היטב למציאות מעבדתית.

מיפוי נוף הולך וגדל של שליטה חלבונית
על ידי שילוב ייצוגים חלבוניים שנלמדו, רשת עצבית מתקדמת ואימון מרובת משימות, המחברים מעריכים כי ה"מתילום" של הליזין האנושי עשוי להכיל בערך 155,000 אתרים — הרבה יותר מאשר הערכה קודמת. הניתוח שלהם מראה שמתילציה חזויה מרוכזת במיוחד בחלבונים המעורבים בתרגום, בעיבוד RNA ובשלד התאי, בהתאם לרמזים קודמים שמערכות אלה מכוּונות בקפידה על־ידי תגים כימיים. מכיוון ש-MethylSight 2.0 זמין כשרת רשת ציבורי וכתוכנה להורדה, חוקרים יכולים כעת לסרוק את החלבונים שמעניינים אותם, לתת עדיפות לניסויים ולחפש בצורה יעילה יותר אירועי מתילציה הקשורים למחלה. במונחים מעשיים, עבודה זו מספקת גם מפה חדה יותר וגם מצפן טוב יותר לחקור כיצד עריכות כימיות עדינות לחלבונים מעצבות בריאות ומחלה.
ציטוט: Charih, F., Boulter, M., Biggar, K.K. et al. Leveraging learned representations and multitask learning for lysine methylation site discovery. Sci Rep 16, 10212 (2026). https://doi.org/10.1038/s41598-026-39136-9
מילות מפתח: מתילציה על ליזין, שינוי פוסט-תרגומי, מודלים של שפת חלבון, למידת עומק בפרוטאומיקה, אפיגנטיקה של סרטן