Clear Sky Science · he

מודל שפה רב־מצבי למדעי החומרים

· חזרה לאינדקס

מדוע חומרים חדשים חשובים בחיי היומיום

מהפיתוחים בסוללות טלפון משופרות ועד לפאנלים סולאריים יעילים יותר ומחשבים מהירים יותר — רבות מהטכנולוגיות של המחר תלויות בגילוי ובהשבחה של חומרים חדשים. עם זאת, לקבוע אילו שילובים של אטומים יעניקו בדיוק את התכונות הרצויות דומה לחיפוש מחט בערמת שיער קוסמית. מאמר זה מציג את MatterChat, מערכת בינה מלאכותית שנועדה לשוחח עם מדענים בשפה יומיומית ובאותה נשימה "לראות" את המבנה האטומי המפורט של חומרים, ולסייע בחיזוי התנהגותם וכיצד ניתן לייצרם במעבדה.

Figure 1
Figure 1.

עוזר דיגיטלי שרואה אטומים וקורא מילים

MatterChat נבנה כדי לשלב שני סוגי מידע שונים מאוד: הסדר התלת־ממדי המדויק של האטומים במוצק והידע והשאלות הטקסטואליות שמדענים משתמשים בהם. מצד אחד, המערכת מקבלת מבנה גבישי, שניתן לייצגו כרשת של אטומים וקשרים. היא מעבדת זאת באמצעות מודלים חזקים בהשראת פיזיקה שאומנו על מאות אלפי חומרים ידועים כדי לייצר טביעות אצבע נומריות דחוסות לכל אטום וסביבתו. מצד שני, מודל שפה גדול — מבוסס על המערכת בקוד פתוח Mistral 7B — ממיר את שאלת המשתמש, למשל על יציבות או התנהגות אלקטרונית, לייצוג פנימי משלו. מודול "גשר" שתוכנן במיוחד לומד לאחר מכן כיצד ליישר בין שני העולמות הללו כך שמודל השפה יוכל להסיק ישירות על מה שהאטומים עושים.

הלמדת המערכת באמצעות קטלוג עשיר של חומרים

לאימון MatterChat ניגשו המחברים למסד נתונים גדול שכלל 142,899 חומרים אי־אורגניים מפרויקט Materials Project. עבור כל חומר הם השתמשו לא רק במבנה האטומי המלא אלא גם בתריסר סוגי מידע תיאורי. אלה נ rangedו ממזהים בסיסיים כגון נוסחה כימית, סוג סימטריה ומשפחת גביש ועד תשע תכונות מרכזיות כולל האם החומר מתכתי או מבודד, מרווח הפסים האלקטרוני שלו, התנהגות מגנטית ומדדים שונים של יציבות תרמודינמית. בזיווג כל מבנה עם שאלות ותשובות בסגנון טקסט על תכונות אלה, המערכת למדה לקשר דפוסים בסידורי האטומים עם המילים שמדענים משתמשים בהן לתיאור ולניתוח חומרים.

מבחיפוש פשוט להיסקים בסגנון מדעי

לאחר האימון, MatterChat מסוגל יותר מלחזור על רשומות מסד נתונים. כאשר משתמש מספק מבנה, המערכת יכולה לענות על טווח רחב של שאלות, כגון זיהוי הנוסחה, הערכת האם סביר שהחומר יתקיים במעבדה, או הערכת אנרגיות שלרוב דורשות חישובים כמותיים כבדים של מכניקת הקוונטים. המחברים מציגים דוגמאות שבהן MatterChat מספק הערכות מפורטות של חומרים ספציפיים, כולל הערות על יציבות, מרווחים אלקטרוניים ומגנטיות. במקרים מסוימים המערכת הולכת אף רחוק יותר ויוצרת מתכוני מעבדה סבירים שלב־אחר־שלב להכנת תרכובות מוכרות כמו ניטריד הגליום ו־yttrium iron garnet, תוך שהיא שואבת מהידע המדעי הכללי השמור במודל השפה ומגובה בתשובות המבוססות על המבנה הגבישי שסופק.

Figure 2
Figure 2.

מתחרה בצ׳אטבוטים כלליים על מספרים קשים

תוצאה בולטת היא ש‑MatterChat מנבא תכונות כמותיות של חומרים טוב יותר הן ממודלי שפה מסורתיים והן ממספר כלים ייעודיים מבוססי־פיזיקה ולמידת מכונה. בתשעת משימות הבנצ׳מרק הוא מדויק יותר בקביעת מאפיינים כגון האם מוצק הוא מתכתי, יציב או מגנטי. עבור כמויות רציפות כמו אנרגיית היווצרות או מרווח הפסים, התחזיות שלו קרובות יותר לערכים שחושבו באמצעות סימולציות ממוחשבות תובעניות. זה נכון גם כאשר נבדק על אוסף נפרד של תרכובות שנתגלו לאחרונה בפרויקט GNoME, שלא שומשו באימון. המחברים גם מנתחים את הייצוגים הפנימיים של המערכת ומראים שמבנים דומים מצטברים יחד וכי שינויים ביציבות מתקדמים באופן חלק במפה פנימית זו, מה שמרמז שהמודל למד דפוסים בעלי משמעות כימית.

מה המשמעות של זה לגילוי חומרים חדשים

עבור קוראים לא־מומחים, המסקנה המרכזית היא ש‑MatterChat מתפקד כשותף לשיחה שמבין גם שפה מדעית וגם מחזיק בקנה מידה מפורט של סידור האטומים במוצקים. על ידי איחוד היכולות הללו, הוא יכול לענות במהירות על שאלות שבעבר דרשו אינטואיציה מקצועית וחישובים יקרים, והוא יכול להציע נתיבי סינתזה ריאליסטיים למועמדים מבטיחים. אף שהמחברים מציינים שהמערכת עדיין מתקשה במספרים בעלי דיוק קיצוני ולעתים עלולה לנחש בביטחון מופרז, הם טוענים שעיצוב מודולרי וביצועים חזקים מסמנים צעד משמעותי לקראת כלים מבוססי־AI שיעזרו למדענים לנווט במרחב העצום של חומרים אפשריים ולהאיץ את הדרך מרעיונות לטכנולוגיות עובדות.

ציטוט: Tang, Y., Xu, W., Cao, J. et al. A multimodal large language model for materials science. Nat Mach Intell 8, 588–601 (2026). https://doi.org/10.1038/s42256-026-01214-y

מילות מפתח: גילוי חומרים, בינה רב־מצבית, מבני גביש, חיזוי תכונות, צ׳אטבוטים מדעיים