Clear Sky Science · he

טרנספורמר מאומן מראש איביארי לא־סדיר לצורך למידה מאוחדת של ייצוגים מולקולריים תלת־ממדיים

· חזרה לאינדקס

להקנות למחשבים ראייה תלת־ממדית של מולקולות

עיצוב תרופות וחומרי חדשנות תלוי בהבנה של איך מולקולות באמת נראות ונעות במרחב התלת־ממדי — לא רק כפורמולות שטוחות על הנייר. מאמר זה מציג מודל בינה מלאכותית רב־עוצמה שיכול ללמוד מהצורות התלת־ממדיות של סוגים רבים של מולקולות בו־זמנית — החל מחומרים קטנים בדמות תרופות ועד חלבונים גדולים ומורכבים — ואז להשתמש בידע זה כדי לחזות עד כמה הן אינטראקטיביות ואילו מהן עשויות להפוך לתרופות עתידיות.

מפה אחת לעולמות מולקולריים רבים

מרבית כלי ה‑AI הקיימים בכימיה הם מומחים צרי־תחום: אחד מאומן רק על מולקולות קטנות, אחר רק על חלבונים, ושלישי רק על קומפלקסים שלהם. הפרדה זו מבזבזת נתונים ומקשה להעביר מה שנלמד בתחום אחד לאחר. המחברים בונים במקום זאת מודל יסוד יחיד, שנקרא ה‑Equivariant Pretrained Transformer (EPT), שלומד ממאגר נרחב של מבנים תלת־ממדיים מולקולריים הנלקחים ממספר מאגרי מידע ציבוריים. על ידי הטיפול בכל המבנים הללו במסגרת משותפת אחת, המודל יכול לזהות דפוסים משותפים בארגון האטומים ובאינטראקציות ביניהם, בין אם אלה שייכים למולקולה פשוטה כמו תרופה ובין אם לחבל מורכב של שרשראות חלבוניות.

Figure 1
Figure 1.

לשבור מולקולות לחתיכות שניתן לנהל

כדי להתמודד עם המגוון והגודל העצומים של מערכות מולקולריות, החוקרים מציעים את רעיון ה"בלוקים" — קטעים קטנים ובעלי משמעות של אטומים. במולקולות קטנות, בלוק מרכז אטום כבד עם המימנים הקשורים אליו; בחלבונים, כל חומצת אמינו הופכת לבלוק. במהלך האימון המודל רואה הן את האטומים הדקים והן את מבנה הבלוקים הגס, מה שמאפשר לו לקשר פרטים כימיים מקומיים עם צורות תלת־ממדיות רחבות יותר כגון שלד החלבון או כיסי קשירה. מבט הבלוקים הזה גם יוצר שפה משותפת שעובדת על סוגים מולקולריים שונים מאוד, מה שמאפשר למודל יחיד להבין את כולם.

למידה באמצעות ניקוי מבנים רועשים

במקום לקבל תוויות מפורשות כגון "מולקולה זו מסיסה" או "זאת נקשרת חזק", EPT מאומן באופן ללא־השגחה. המחברים מפריעים בכוונה לכל בלוק מולקולרי, מזיזים ומסובבים אותו באקראי מהמיקום האמיתי שלו, ואז מבקשים מהמודל להסיק את הכוחות והסיבובים הנדרשים להחזיר את המבנה המקורי. מאחר שהאימון מציית לכללי הגיאומטריה הבסיסיים — המערכת כולה צריכה להראות אותו הדבר אם מסובבים או מזיזים אותה בחלל — המודל לומד תחושת צורה תלת־ממדית שהגיונית מבחינה פיזיקלית. משחק הניקוי הזה מלמד את EPT איך אטומים בתוך בלוקים ובין בלוקים מתקשרים יחד ואיך שינויים עדינים בגיאומטריה משפיעים על היציבות.

Figure 2
Figure 2.

מבחן על המודל

לאחר אימון מקדים על יותר מחמישה מיליון מבנים, EPT מותאם (fine‑tuned) למספר משימות מדעיות ממשיות. הוא חוזה עד כמה מולקולה קטנה נקשרת לכיס בחלבון, איך מוטציה בודדת בממשק חלבוני משפיעה על הקשירה, ותכונות פיזיקליות מפתח של מולקולות קטנות החשובות לכימאים. על פני מבחנים מגוונים, המודל המאוחד משווה או עוקף את הכלים הטובים ביותר הקיימים, כולל אלה שעוצבו בקפידה לכל תחום בנפרד. באופן בולט, כאשר מאמנים אותו על סוג אחד של נתונים, כמו מולקולות קטנות, הוא עדיין מסייע במשימות שנראות שוות־משקל שונות, כגון קשירה חלבונית, מה שמעיד שהוא לקח עקרונות כימיים כלליים ושימושיים ולא תחבולות צרות.

חיפוש טיפולים חדשים לקורונה

המחברים מדגימים גם את הערך המעשי של EPT על ידי השימוש בו לאתגר תיעוד שימושי תרופות מחדש. הם קודם כל מבצעים אדפטציה של המודל על קומפלקסים של חלבון–ליגנד ואז משתמשים בו כדי לדרג כמעט 2,000 תרופות שאושרו כבר לפי יכולתן החזויה לקשור את הפרוטאז המרכזי של SARS‑CoV‑2, אנזים מפתח שהווירוס זקוק לו לשכפול. תרופות ידועות נגד COVID‑19 מתבלטות בראש הדירוג, והמודל מדגיש מועמדים מבטיחים נוספים. תריסר מולקולות בעלות ציון גבוה נבחנו ביתר פירוט בסימולציות ממוחשבות, ושתיים — כולל אחת שלא פותחה במקור עבור COVID‑19 — הראו קשירה חזויה חזקה במיוחד ואושרו בניסויים לעכב את הפרוטאז הויראלי ברמות מיקרומולריות.

צעד לעבר בינה מולקולרית כללית

לשון פשוטה, עבודה זו מראה שמודל בינה מלאכותית אחד, המודע לגיאומטריה, יכול ללמוד הבנה תלת־ממדית משותפת של מערכות מולקולריות רבות ואז להשתמש בה למענה על מגוון רחב של שאלות מדעיות. באמצעות ארגון מולקולות לבלוקים ואימון המודל "לתקן" מבנים מעוותים, המחברים יוצרים כלי שלא רק חוזה ערכים בדיוק רב יותר אלא גם מאיץ משימות כמו מציאת תרופות אנטי־וירליות חדשות. EPT מצביע לכיוון עתיד שבו מערכות בינה כלל־מטרתיות למולקולות יסייעו לכימאים וביולוגים לחקור את מרחב המולקולות ביעילות רבה יותר, להנחות ניסויים ולקצר את הדרך ממבנה אטומי לטיפולים וחומרים מעשיים.

ציטוט: Jiao, R., Kong, X., Zhang, L. et al. An equivariant pretrained transformer for unified 3D molecular representation learning. Nat Commun 17, 2606 (2026). https://doi.org/10.1038/s41467-026-69185-7

מילות מפתח: ייצוג מולקולרי תלת־ממדי, טרנספורמר איביארי, גילוי תרופות, קשירה חלבון–ליגנד, למידה ללא השגחה