Clear Sky Science · he
מודל שפה לצמדים של רצפים למידול אינטראקציות בין חלבונים
מדוע חשוב למחקר שותפויות חלבוניות
בתוך כל תא, חלבונים נדירם עובדים לבד. הם מצטרפים בזוגות או בקבוצות גדולות יותר להעברת סיגנלים, לבניית מבנים ולהתגוננות מפני זיהומים. לדעת אילו חלבונים מתקשרים, עד כמה הם נקשרים בחוזקה ובאיזה אתרים בדיוק הם נוגעים זה בזה, יכול לחשוף כיצד תאים מתפקדים ואיך מחלות נוצרות. מדידת כל השותפויות האלה במעבדה איטית ויקרה. המחקר הזה מציג מודל בינה מלאכותית חדש שקורא זוגות רצפי חלבון יחד, ולומד לזהות מי נקשר עם מי, עד כמה חזק הקשר ובאיזה נקודות מגע — תוך שימוש רק ברצפי חומצות האמינו כקלט.
דרך חדשה לקרוא שני חלבונים בו בזמן
רוב מודלי השפה לחלבונים הנוכחיים מתייחסים לכל שרשרת חלבון כאילו היא לבד, ומתעלמים מקשרי האינטראקציה האפשריים עם שותפים. המחברים בנו במקום זאת "מודל שפה לצמד חלבונים" (PPLM) שמסתכל תמיד על שני רצפים זה לצד זה. הוא משתמש בארכיטקטורת טרנספורמר, סוג של מודל למידה עמוקה שזכה לפופולריות בטכנולוגיות שפה, אך מותאם ביכולת לעקוב בנפרד אחרי דפוסים בתוך כל חלבון ובין שני החלבונים. לאימונו, הצוות אסף יותר מ-3.3 מיליון זוגות חלבון ממסדי נתונים מבניים ומרשתות אינטראקציה, מה שנתן למודל תמונה רחבה של האופן שבו חלבונים טבעיים נוטים לצמד בחיים האמיתיים.

חשיפת אותות אינטראקציה החבויים ברצפים
כדי לבדוק האם PPLM באמת מבין שותפויות חלבוניות, המחברים ביקשו ממנו לחזות חומצות אמינו מוסתרות בזוגות רצפים והשוו אותו למודל מוביל שמתבונן ברצף יחיד בשם ESM2. לאורך אלפי זוגות חלבון ממקורות שונים, PPLM הראה ביטחון ודיוק גבוהים יותר באופן עקבי, במיוחד ברצוזים הממוקמים ממש בממשק שבו החלבונים נוגעים זה בזה. על ידי הצגה חזותית של דפוסי ה"תשומת לב" הפנימיים של המודל, החוקרים הראו ש-PPLM מתמקד באופן טבעי באותם אזורי מגע, אף שלא הוזהר במפורש היכן נמצא הממשק. במחקר מקרה מפורט של קומפלקס חלבוני ידוע, זוגות הרצוזים שזכו לתשומת לב הגבוהה ביותר התאימו לרוב המגעים שהתגלו בניסויים במרחב התלת־ממדי.
ממהבנה בסיסית לחיזויים מעשיים
בהתבסס על יסוד זה, הצוות יצר שלושה כלים יישומיים. PPLM-PPI חוזה האם שני חלבונים צפויים בכלל להתחבר. במבחנים על חמש מינים שונות הוא עלה על מספר שיטות מתקדמות מבוססות רצף, וסיפק קריאות אינטראקציה מדויקות ויציבות יותר גם כאשר חלבוני המבחן היו שונים משמעותית מאלו שבאימון. PPLM-Affinity מעריך כמה חזק הקשר בין שני חלבונים. בבנצ׳מרק גדול של קומפלקסים עם מדידות חוזק קשירה, הוא לא רק התעלה על גרסה של ESM2 שמותאמת למשימה זו, אלא גם על שיטה מיוחדת המשתמשת במבנים תלת־ממדיים מפורטים. השיפורים בולטים במיוחד במערכות בעלות חשיבות רפואית כגון נוגדנים הקושרים אנטיגנים וקולטנים של תאי T שמזהים מטרות חיסוניות.
זיהוי מדויק של נקודות המגע בין חלבונים
הכלי השלישי, PPLM-Contact, מתמקד בזיהוי אילו זוגות רצוזים בין שני חלבונים למעשה באים במגע. הוא משלב את דפוסי התשומת לב החוצי־חלבון של PPLM עם מידע אבולוציוני מתוך יישורי רצפים מרובים ומפות מרחק ממבני חלבון בודדים. במספר מערכות מבחן מאתגרות, PPLM-Contact שחזר במדויק מפות מגע וזיהה רצוזים ממשקיים טוב יותר משיטות קיימות, כולל כאלה שתלויות במידה רבה בקלט מבני. גרסה משופרת, PPLM-Contact2, הולכת צעד נוסף ומשלבת מבנים צפויים של קומפלקסים ממערכות מודרניות של דוגמנות תלת־ממד. הגישה ההיברידית הזו משפרת את חיזוי המגעים אף מעבר למה שמנבאים אותן המערכות המבניות, ומספקת תמונה חדה יותר של משטחים קושרים ומיקום מהימן יותר של אתרי קשירה.

מה משמעות הדבר לביולוגיה ולרפואה
במבט כולל, העבודה מראה שקריאת רצפי חלבון בזוגות, במקום כל אחד לחוד, מאפשרת למודלי בינה ללכוד דפוסים עדינים של אינטראקציה שמניעים את החיים התאיתיים. PPLM הנגזרות ממנו יכולות לומר האם שני חלבונים צפויים להיפגש, עד כמה הם נוגעים בחוזקה, ואילו חומצות אמינו יוצרות את ה"לחיצת היד"—והכול מתוך מידע רצפי שהוא זול ושפע. למרות שהשיטה עדיין מתקשה עם ממשקים קטנים או חלשים מאוד ותלויה במגוון נתוני האימון הזמינים, היא מציעה מסלול שניתן להרחבה למיפוי רשתות אינטראקציה והנחיית עיצוב של נוגדנים, קולטני תאי T וצורות אחרות של תרופות ביולוגיות. מהותית, המחקר מדגים שמודלי שפה המייצגים באופן משולב יכולים להפוך נתוני רצף גולמיים לתובנות עשירות ומודעות אינטראקציה על אופן שיתוף הפעולה של חלבונים.
ציטוט: Liu, J., Chen, H. & Zhang, Y. A paired sequence language model for protein-protein interaction modeling. Nat Commun 17, 3733 (2026). https://doi.org/10.1038/s41467-026-70457-5
מילות מפתח: אינטראקציות חלבון–חלבון, מודלי שפה לחלבון, אפיניות קשירה, חיזוי מגעי ממשק, ביולוגיה מבנית חישובית