Clear Sky Science · he
אופטימיזציה מבנית של מולקולות תרופה באמצעות מודלים לשוניים מאומנים בהדרגה
ללמד מחשבים להתעסק בתרופות
תרופות מודרניות מתחילות לעיתים כמולקולות מבטיחות אך בלתי מושלמות, שכימאים נדרשים לכוונן בקפידה כדי שהן יהפכו לתרופות בטוחות ויעילות. המחקר מראה כיצד מערכת בינה מלאכותית ש"קוראת" נוסחאות כימיות כמו שפה יכולה ללמוד לבצע חלק מהכוונונים הללו בעצמה, ולהציע מועמדי תרופות חדשים העשויים להיות עוצמתיים יותר מהדוגמות הטובות הידועות — ללא הסתמכות על כלי דירוג חיצוניים או ניסוי וטעייה המבוססים על דיווחים מקריים.

למה אופטימיזציה של מולקולות תרופה כל כך קשה
לאחר שמצאו מולקולה התחלתית שמשפיעה על יעד ביולוגי, העבודה האמיתית מתחילה: להפוך את ה"היט" המוקדם לדבר חזק, סלקטיבי ומתאים כתרופה. באופן מסורתי כימאים מעצבים עשרות או אפילו מאות קרובים למבנה המקורי, מסנתזים אותם במעבדה ובודקים כל אחד. מחזורי עיצוב–ייצור–בדיקה אלה דורשים שנות מומחיות ומאמצים ניסיוניים נרחבים. שיטות ממוחשבות ניסו לסייע, אך רבות מהן מתמקדות בתכונות פשוטות — למשל כמה שמן המולקולה — ולא בחוזק הביולוגי המלא שהיא מספקת. שיטות אחרות תלויות בכלי חיזוי נפרדים ("אורקלים") שמעריכים פעילות ועלולות להיות לא מהימנות או שאינן זמינות עבור יעדים רבים.
שימוש ב"משפטים" כימיים להנחיית התכנון
המחברים בונים על מודלי שפה כימיים, סוג של מערכת למידה עמוקה שמתייחסת למולקולות כמחרוזות תווים (SMILES) ולומדת את ה"דקדוק" וההתניות שעושות מבנה לכימית וטבעית מבחינה ביולוגית. בראשיתם מאמנים מודל על מאות אלפי מולקולות ביואקטיביות ידועות, תוך סינון מכוון של כל מה שקשור ליעדים הספציפיים שהם יבחנו בהמשך. זה מייצר מודל כללי שמבין כימיה אך חסר ידע מוקדם על הקולטים הנבחרים, ובכך מבטיח שכל הצלחה עתידית באמת נובעת מהאימון החדש ולא מהטיה סמויה בנתוני ההתחלה.

מאפשרים למודל ללמוד כמו כימאי רפואי
בפרויקטים תרופתיים אמיתיים כימאים בונים בהדרגה מפה בין מבנה לפעילות: שינויים קטנים בגרעין יכולים להחליש או להעצים תרכובת. החוקרים מחקים תהליך זה באמצעות הזנת המודל בסדר מוקפד של סדרות מולקולות קשורות, שנקראות סדרות מבנה–פעילות (SAR). במקום לכוונן את המודל ב"מכה אחת" על כל הדוגמאות הידועות, הם מפצלים כל סדרה לשלבים על בסיס עוצמת הפעילות, מהחלשים לחזקים. בתחילה המודל נחשף לתרכובות הפחות פעילות, ואז עוברים לכוונון מדורג עם תת־קבוצות המכילות דוגמאות בעלות עוצמה גבוהה יותר. "אימון הדרגתי" זה יוצר מסלול למידה שבו המודל מונחה בעדינות לעבר אזור במרחב הכימי שבו שוכנות המולקולות הטובות ביותר.
מהתיאוריה למועמדי תרופות חדשים ועוצמתיים יותר
כדי לבדוק האם אסטרטגיית האימון הזו באמת מסייעת, הצוות בודק תחילה האם המודל יכול "לגלות מחדש" מולקולות בעלות פעילות גבוהה שהוסרו בכוונה מאימון. עם אימון הדרגתי המודל מייצר עיצובים מדורגים שמתחברים לאותן תרכובות חזקות מוסתרות בתדירות גבוהה יותר ממודלים שאומנו בשלב יחיד, מה שמעיד שהוא הפנים את הדפוסים שמניעים פעילות גבוהה. המחברים ממשיכים לעיצוב בעולם האמיתי עבור שני יעדים רפואיים רלוונטיים: PPARγ, המעורב במטבוליזם ודלקת, ו‑RORγ, המשתתף בוויסות החיסון. לאחר אימון הדרגתי על ליגנדים ידועים לכל יעד, המודל מציע אנלוגים חדשים של גרעינים נבחרים. כאשר כמה מהעיצובים האלה מסונתזים ונבדקים במעבדה, כל תשעת העיצובים ל‑PPARγ מסתמנים כאגוניסטים בעלי עוצמה גבוהה, רבים מהם עולים בהרבה על המולקולה הטובה ביותר שהייתה ידועה, ועיצוב חדש ל‑RORγ כמעט מגיע לעוצמה של החומר החזק ביותר בסדרה בעודו שונה מבנית.
מה משמעות הדבר עבור תרופות עתידיות
בהצגת יכולת של מודל בסגנון שפה לא רק להמציא מולקולות אלא גם ללטש גרעינים קיימים כך שיעקפו את הדוגמות הטובות ביותר — בלי להישען על כלי דירוג חיצוניים — עבודה זו מצביעה על דרך חדשה לביצוע כימיה רפואית. גישת האימון ההדרגית מאפשרת למודל לספוג כללים עדינים של מבנה–פעילות ואת התלותים לטווח הארוך שלהם, ואז להרחיב אותם לאזור שלא נבחן קודם. עבור קהל לא־מומחה, המסקנה המרכזית היא שבינה מלאכותית יכולה כעת לפעול פחות כמו מחולל רעיונות אקראי ויותר כמו עוזר כימאי מאומן דיגיטלית, שמציע שיפורים ממוקדים ובעלי יכולת בדיקה למולקולות מבטיחות — ובאופן פוטנציאלי מואץ את המסלול מהיט מוקדם לתרופות ממוטבות.
ציטוט: Hörmann, T., Mayer, D., Lewandowski, M. et al. Structural optimization of drug molecules with incrementally trained language models. Nat Commun 17, 3456 (2026). https://doi.org/10.1038/s41467-026-71591-w
מילות מפתח: מודלי שפה כימיים, תכנון תרופות de novo, קשרי מבנה–פעילות, כימיה גנרטיבית, בינה מלאכותית בכימיה רפואית