Clear Sky Science · he

JanusDDG: רשת עצבית מודעת פיזיקה לחיזוי יציבות חלבונים מבוססת רצף באמצעות תשומת לב דו-חזיתית

· חזרה לאינדקס

מדוע מחקר זה חשוב

חלבונים הם המכונות הזעירות שמצליחות לשמור על תפקוד התאים שלנו, ושינוי יחיד בחומרי הבניין שלהם יכול לגרום להם לפעול טוב יותר, לגרוע בתפקודם או להפסיק לפעול כלל. היכולת לחזות כיצד שינויים כאלה משפיעים על יציבות חלבון היא חיונית להבנת מחלות גנטיות ולפיתוח תרופות ואנזימים תעשייתיים טובים יותר. המאמר מציג את JanusDDG, מודל בינה מלאכותית חדש שחוזה כיצד מוטציות משפיעות על יציבות חלבונים באמצעות רצף החלבון בלבד, ובו־זמנית שומר על עקרונות הפיזיקה הבסיסיים המכתיבים את קיפול החלבון.

בעיה של מכונות חלבון שבירות

כאשר חלבון מתקפל לצורה התלת‑ממדית שלו, הוא מאזנת כוחות רבים, בדומה לאוהל הנתמך על‑ידי חבלים רבים. מוטציות יכולות להדק חבלים מסוימים או לשחרר אחרים, ולגרום למבנה להיות יציב יותר או פחות. בדיקות ניסויית של השפעות אלה איטיות ויקרות, לכן חוקרים מסתמכים במידה רבה על מודלים ממוחשבים להערכת שינויים ביציבות, הנקראים ΔΔG. כלים קיימים עובדים היטב כאשר יש להם גישה למבנים תלת‑ממדיים מפורטים, ולעיתים הם עלולים להפר באופן שקט את חוקי התרמודינמיקה, מה שמייצר תחזיות שנראות מדויקות על הנייר אך אינן עקביות פיזיקלית או שקשה לבטוח בהן עבור חלבונים חדשים.

Figure 1
Figure 1.

דרך חדשה לקרוא רצפי חלבון

JanusDDG מתמודד עם האתגר על‑ידי שימוש בדגמי שפה של חלבונים, קבוצת רשתות נוירוניות גדולות שאומנו על מיליוני רצפי חלבונים, בדומה לאופן שבו דגמי שפה לומדים מטקסט. דגמים אלה ממירים כל חומצה אמינית לייצוג מספרי עשיר שתופס דפוסים מאבולוציה והתנהגות קיפול טיפוסית. JanusDDG לוקח את רצף החלבון המקורי ואת רצף המוטנט, משווה בין הייצוגים הנלמדים שלהם ומשתמש במנגנון תשומת לב מותאם שמתמקד באופן שבו המוטציה משבשת את ההקשר הסובב. מכיוון שהוא זקוק רק לרצפים, ניתן להחיל את JanusDDG על חלבונים שמבנה ה‑3D שלהם אינו ידוע או שקשה לקבועו.

הטמעת פיזיקה בתוך בינה מלאכותית

החדשנות המרכזית של JanusDDG היא שזוהי מערכת שתוכננה לכבד עקרונות פיזיקליים בסיסיים. המחברים מתמקדים בשתי תכונות של אנרגיה חופשית של גיבס, הכמות שעומדת בבסיס יציבות החלבון. ראשית, אנטיסימטריה משמעותה שאם מעבר מגרסה אחת לאחרת משנה יציבות בסכום מסוים, המעבר ההפוך חייב לבטל את ההשפעה. שנית, מעבריות (טרנזיטיביות) משמעותה שסכום ההשפעות של מעבר מגרסה ראשונה לשנייה ואחר כך לשלישית שווה להשפעה של קפיצה ישירה מהראשונה לשלישית. הארכיטקטורה של JanusDDG מחייבת אנטיסימטריה על‑ידי הרצת שתי עותקים מראות של הרשת על קלטים מוחלפים ושילוב התוצאות כך שהתחזיות קדימה ואחור תהיינה בדיוק הפוכות. טרנזיטיביות מעודדת במהלך האימון על‑ידי הוספת תנאי אובדן מיוחד שמניע את המודל לתת תחזיות עקביות כאשר מסלולי מוטציה נחלקים לצעדים.

Figure 2
Figure 2.

בדיקת ביצועים על סוגים רבים של מוטציות

החוקרים אימנו את JanusDDG על מאגר מטופח של אלפי מוטציות עם שינויים ביציבות מדודים ואז בדקו אותו על מספר קריטריונים בלתי תלויים שבהם חפיפה ברצפים עם נתוני האימון נשמרה נמוכה מאוד. עיצוב זה מקטין את הסיכון שהמודל פשוט זוכר חלבונים מוכרים. בשלוש אוספים נפוצים של מוטציות חד‑נקודתיות, JanusDDG השווה או עלה על ביצועי כלים אחרים מבוססי‑רצף והרבה שיטות התלויות במבנה תלת‑ממדי. כמו כן הוא טיפל במוטציות מרובות בו‑זמנית, תרחיש קשה יותר שבו אינטראקציות בין שינויים יכולות להיות לא‑חיבוריות. באופן מרשים, הדיוק שלו לא ירד עבור זוגות מוטציות הקרובות במרחב, מצבים שבהם מודלים קודמים לרוב התקשו.

ממספרים לתוויות יציבות שימושיות

בתחומים מעשיים, חוקרים לעתים רוצים לדעת לא רק מה גודל השינוי ביציבות, אלא האם מוטציה היא באופן ברור מייצבת או מפחיתה יציבות. המחברים בדקו את JanusDDG על מערך נתונים שממוקד בהבחנה בין זנים מייצבים לזנים שמפרים יציבות. אף שניבוי הערכים המספריים הגיע לביצועים טובים, המשימה הזו נותרה קשה יותר, בייחוד בקרבת הסף בין הקטגוריות שבהם רעש ניסויי ואמביגואיות ביולוגית גבוהים במיוחד. אף על פי כן, JanusDDG השווה לטובה מול שיטות מובילות אחרות, דבר שמרמז שעיצובו המודע לפיזיקה והשימוש בהטמעות רצף עשירות מסייעים לו להתמודד טוב יותר עם אי‑הוודאות לעומת מתחרים רבים.

מה זה אומר לעתיד של עיצוב חלבונים

בסך הכל, JanusDDG מראה שאפשר לשלב את חוזקות הבינה המלאכותית המודרנית המבוססת על רצף עם המגבלות המוצקות של חוקי הטבע. על‑ידי התייחסות לחלבונים כרצפים שניתן לקרוא אותם כשפה, ובאותו זמן התעקשות שהתחזיות יעמדו בראיות אנטיסימטריות וטרנזיטיביות, המודל מייצר הערכות יציבות שהן גם מדויקות וגם עקביות תרמודינמית. עבור קהל לא־מומחה, המסקנה היא שאנחנו מתקרבים לכלים אמינים שאינם דורשים מבנה, שיכולים לסרוק אינספור מוטציות אפשריות, לסמן את אלה שסביר שייצבו חלבון או להצביע על שינויים מסוכנים הקשורים למחלה — וכל זאת תוך שמירה על בסיס בחוקי הפיזיקה במקום קיצורי דרך סטטיסטיים בלבד.

ציטוט: Barducci, G., Rossi, I., Codicé, F. et al. JanusDDG: a physics-informed neural network for sequence-based protein stability via two-fronts attention. Commun Biol 9, 494 (2026). https://doi.org/10.1038/s42003-026-09632-9

מילות מפתח: יציבות חלבון, מוטציות גנטיות, עיצוב חלבונים, למידת מכונה, תרמודינמיקה