Clear Sky Science · he

POLYT5: מודל יסוד מקודד-מפענח לשפת כימיה לעיצוב פולימרים גנרטיבי

· חזרה לאינדקס

ללמד מחשבים את שפת הפלסטיק

פלסטיק ופולימרים אחרים נמצאים בכל מקום — ממארזי טלפונים וכבלי חשמל ועד לסוללות לרכבים חשמליים. עם זאת, גילוי פולימרים חדשים עם השילוב המדויק של חוזק, גמישות והתנהגות חשמלית הוא תהליך איטי ויקר. המאמר מציג את POLYT5, מערכת בינה מלאכותית שלומדת את "שפת" הפולימרים כדי גם לחזות את תכונותיהם וגם להגות מועמדים מבטיחים, ולסייע למדענים לעצב במהירות חומרים לאלקטרוניקה מתקדמת ואחסון אנרגיה.

Figure 1
Figure 1.

מדוע קשה למצוא פולימרים חדשים

עיצוב פולימר חדש דומה לחיפוש משפט מועיל אחד בספרייה של כל צירופי האותיות האפשריים. כימאים יכולים לשנות בלוקים בניין ולבחון תוצאות, אך מספר האפשרויות עצום. למידת מכונה מסורתית סייעה בחיזוי תכונות של פולימרים ידועים, אך כלים אלה בדרך כלל מסתמכים על מתארים מספריים מעשה ידי אדם ועדיין דורשים מאנשים לשער אילו מבנים לנסות. מודלים לשוניים כלליים יכולים לייצר מולקולות, אך לעתים חסר להם ה"שכל הישר" הכימי הדרוש לעיצוב חומרים אמין — הם מייצרים נוסחאות שמראות תקינות על הנייר אך שאינן מציאותיות או אינן ניתנות לסינתזה במעבדה.

מתן אוצר מילים ממוקד פולימרים ל-AI

POLYT5 מתמודד עם האתגר הזה על ידי אימון מודל שפה במיוחד על מבני פולימרים, במקום על טקסט גנרי. המחברים ריכזו מערך אימון נרחב: יותר מ‑12,000 פולימרים אמיתיים מהספרות ועוד יותר מ‑100 מיליון פולימרים השערתיים שנוצרו באמצעות תגובות מבוססות ומוכרות לשימוש כימאי. כדי להזין מבנים אלה למודל שפה, המירו כל פולימר לייצוג מחרוזתי חזקה שמבטיח מולקולות תקניות מבחינה כימית. טוקנים מיוחדים מסמנים את קצוות היחידה החוזרת ומקודדים מידע תכונתי פשוט. באמצעות ארכיטקטורת המקודד–מפענח של T5, POLYT5 לומד לשחזר חלקים מסומנים במחרוזות הללו, ובכך סופג בהדרגה תבניות חוזרות — כגון גבישים נפוצים וקבוצות פונקציונליות — ואיך הן מתקשרות להתנהגות החומר.

מקריאה של פולימרים לחיזוי התנהגותם

לאחר אימון בקנה מידה גדול זה, POLYT5 מותאם למשימות מעשיות. קבוצה של מודלים חוזה תכונות מפתח של פולימרים: טמפרטורת המעבר הזכוכיתי (שבה הפלסטיק מרוכך), טמפרטורות התכה ופירוק, פער אנרגיות אלקטרוני, מקדם דיאלקטרי (כמה טוב החומר מאחסן אנרגיה חשמלית), והמסיסות בנוזלים שונים. על פני אלפי דוגמאות, תחזיות המודל מתאימות מקרוב לערכים המוכרים, עם שגיאות השוות או טובות יותר מגישות למידת מכונה קודמות. חשוב לציין ש‑POLYT5 מסוגל לטפל בתכונות רבות ושונות באמצעות אותו ייצוג בסיסי, מה שמפחית את הצורך בתכונות מותאמות או בכלים נפרדים לכל משימה.

Figure 2
Figure 2.

לבקש מהמודל להמציא חומרים חדשים

אותו מסגרת יכולה גם לפעול בכיוון ההפוך: במקום לחזות תכונות לפולימר נתון, POLYT5 יכול לייצר מבני פולימרים התואמים מטרה רצויה. המחברים מתמקדים בטמפרטורת המעבר הזכוכיתי משום שהיא קריטית ליציבות מכאנית ותרמית במכשירים. על ידי מתן ערך יעד — למשל 500 קלווין — מבקשים ממנו להפיק ייצוגים מחרוזתיים של פולימרים השערתיים שיוכלו להתרכך סביב אותה טמפרטורה. הצוות בחן כיצד הגדרות דגימה משפיעות על האיזון בין גיוון לתקינות, ולבסוף ייצר מעל שישה מיליון מועמדים ייחודיים, הגיוניים כימית, שמרוכזים סביב הטמפרטורה הנבחרת ושונים מבחינה מבנית מפולימרים ידועים.

למצוא כמה פנינים בין מיליונים

כדי להדגים השפעה בעולם האמיתי, החוקרים שילבו את POLYT5 למטרה ספציפית: פולימרים למבודדים חשמליים בעלי ביצועים גבוהים ולמכשירי אחסון אנרגיה. מתוך המיליונים שנוצרו, הם יישמו מסנן דיגיטלי רב‑שלבי תוך שימוש במנבאים של POLYT5 עצמו. הפולימרים חייבים להציג מקדם דיאלקטרי יחסית גבוה, פער אנרגטי אלקטרוני רחב כדי למנוע פירוק, יציבות תרמית טובה וטווחי עיבוד מעשיים. הם חייבים גם להתמוסס בממיסים ידידותיים לסביבה כמו מים או אתנול ולהיראות נגישים לסינתזה לפי כללי כימיה סטנדרטיים. המסננת הזו מצמצמת את השדה לכ‑18,000 אופציות מבטיחות. מתוכן, הצוות בחר מועמד אחד שמיוצר בקלות. כשהכינו אותו במעבדה ומדדו את תכונותיו, התוצאות הניסויית תואמות את תחזיות POLYT5 ונמצאות בטווחי השגיאה הצפויים.

להנגיש עיצוב פולימרים מתקדם

מעבר למודל הליבה, המחברים בנו ממשק AI "אייג'נטי" שמאפשר للمשתמשים לעבוד עם POLYT5 בשיחה בשפה טבעית. מודל שפה כל‑מטרה מפרש שאלות כמו "חזה את המקדם הדיאלקטרי של פולימר זה" או "הצע פולימרים עם נקודת התכה גבוהה שמתמוססים באתנול", ואז מנתב אותן לכלי POLYT5 המתאימים מתחת למכסה המנוע. סידור זה מסתיר את המורכבות של פורמטי המחרוזות הכימיות ובחירת המודלים, והופך יכולות עיצוב פולימרים מתקדמות לנגישות הן למומחים והן למי שאינם מומחים. בפשטות, POLYT5 מראה שלהעניק ל‑AI את היכולת לקרוא ולכתוב את שפת הפלסטיק יכול לזרז במידה רבה את החיפוש אחר חומרים חדשים ובעלי ביצועים גבוהים, ואת הקיצור האפשרי של הדרך ממסך המחשב למכשירים פעילים.

ציטוט: Sahu, H., Xiong, W., Savit, A. et al. POLYT5: an encoder-decoder foundation chemical language model for generative polymer design. npj Artif. Intell. 2, 30 (2026). https://doi.org/10.1038/s44387-026-00087-1

מילות מפתח: עיצוב פולימרים, מודל שפת כימיה, גילוי חומרים, פולימרים דיאלקטריים, בינה מלאכותית גנרטיבית