Clear Sky Science · he
שיפור חיזוי תכונות חומרים המבוסס על קומפוזיציה באמצעות העברת ידע חוצת־מודאליות
מדוע ניבוי התנהגות חומר חשוב
עיצוב סוללות חדשות, תאים סולריים או סגסוגות חזקות יותר מתחיל לעתים קרובות ממתכון פשוט שמפרט אילו יסודות לערבב. הפיכת אותו מתכון לחומר ממשי עם חוזק, מוליכות או יציבות ידועים דורשת בדרך כלל חישובים קוונטיים יקרים או ניסויים. המחקר הזה מראה כיצד מודלי בינה מלאכותית מתקדמים מבוססי שפה, שנבנו במקור לקריאת טקסט, יכולים ללמוד מסוגי נתונים רבים של חומרים ואז לחזות תכונות חשובות ישירות מתוך נוסחה כימית, ובכך לחסוך בעלויות ובזמן הדרושים לחקירת מרחבים עצומים של תרכובות אפשריות.

ממתכונים לניבויים
כלי הלמידה המסורתיים במדעי החומרים נחלקים לשני גושים. משפחה אחת זקוקה למבני גביש מפורטים, המתארים כיצד האטומים מסודרים בתלת־ממד, ואז יכולה לחזות תכונות באופן מדויק אך בעלות חישובית גבוהה. משפחה אחרת מסתכלת רק על הנוסחה הכימית הכוללת, כמו כמה אטומים מכל יסוד קיימים, מה שזול יותר אך בדרך כלל פחות מדויק. המחברים שואפים לצמצם את הפער הזה: הם רוצים מודלים שרואים רק את הנוסחה אך מתפקדים כמעט כמו שיטות המודעות למבנה, ומאפשרים סינון מהיר של תרכובות שמעולם לא יוצרו או אף לא נבחנו מבנית.
ללמד את ה־AI לדבר שפת החומרים
הצוות בונה על מודלי שפה כימיים, המתייחסים לנוסחה כמחרוזת טוקנים, בדומה למילים במשפט. ראשית, מודלים אלה לומדים למלא חלקים חסרים בנוסחאות — משימת אימון שעוזרת להם לתפוס קביעות לגבי אילו יסודות משתלבים ובאיזה יחס. המחברים גם מוטים את הלמידה הזאת לכיוון חומרים יציבים תרמודינמית, כדי שהמודל ייתן יותר תשומת לב לקומפוזיציות ריאליסטיות. לאחר מכן הם מציגים תפנית קריטית: במקום ללמוד רק מטקסט כמו מודלי שפה מסורתיים, המודלים שלהם מיושרים עם מודל יסוד נפרד שלמד כבר ממקורות רבים, כולל מבני גביש, התנהגות אלקטרונית והתפלגויות מטען. למעשה, מודל השפה יורש ידע מבני עשיר בעודו פועל רק עם נוסחאות.

שתי דרכים לחלוקת ידע
החוקרים חקרו שתי אסטרטגיות משלימות, אותם הם מכנים העברת ידע חוצת־מודאליות באופן מרומז ובאופן מפורש. בגרסה המרומזת, מודל השפה המבוסס נוסחה מאומן להתאים את הייצוגים הפנימיים שמפיק מודל היסוד המולטי־מודאלי, כך שהוא בסתר סופג כיצד מבנים ודפוסים אלקטרוניים קשורים לקומפוזיציה. בגרסה המפורשת, מודל גנרטיבי גדול מציע תחילה מבני גביש סבירים לכל נוסחה, ואז רשתות עצבים גרפיות, הטובות בטיפול ברשתות של אטומים, חוזות תכונות מתוך אותם מבנים. הנתיב הזה בשני שלבים מנסה לשחזר את המידע הגבישי החסר לפני ביצוע הניבוי.
כמה טוב השיטות עובדות
המודלים נבדקו על שני ערכות מבחן גדולות המכסות עשרות גדלים מטרה, מטווחי פס חשובים לתאים סולריים ועד תכונות מכניות כגון מודול גזירה. ברוב המשימות האלה, במיוחד עבור מערכי נתונים מבוססי חישובים קוונטיים, מודלי ההעברה המרומזת מספקים שגיאות ניבוי קטנות יותר לעומת מודלי שפה קודמים ולעתים קרובות מתחרים בחוזקה בשיטות מבוססות מבנה. גם צינור ההעברה המפורשת משפר על מודלי שפה מבוססי קומפוזיציה קודמים אך איטי יותר בשל הצורך לייצר מבני גביש. הפקת מבנים אלה יכולה לקחת עשרות פעמים יותר זמן לכל חומר מאשר ניבוי ישיר של מודל שפה, במיוחד כשקומפוזיציות כוללות הרבה יסודות שונים.
הצצה לתוך התיבה השחורה
כדי להבין מה מודל השפה למד, המחברים מיישמים ניתוח תורת המשחקים שמודד כיצד חלקים שונים של הקלט, לבד או בשילוב, משפיעים על התכונה החזויה. בהתבוננות על מודול הגזירה, שקשור להתנגדות של חומר לשינוי צורה, הם מגלים כי יסודות וקיבוצי יסודות מסוימים מגדילים או מקטינים באופן חזק את הערך, בתיאום עם תרכובות קשיחות ידועות כמו בורידים וקארבידים. כמה דפוסי שלושה טוקנים בנוסחה אף ניתנים לקישור לפרוטוטיפים גבישיים מוכרים, מה שמרמז שהמודל קלט במרומז מוטיבים מבניים מתוך הקומפוזיציה בלבד.
מה זה אומר לגילוי חומרים עתידי
בסך הכול, המחקר מראה ששיתוף ידע בין סוגי נתונים שונים של חומרים יכול לשפר משמעותית חיזוי תכונות כשזמינה רק הנוסחה הכימית. הגישה המרומזת, שבה מודל השפה מונחה על ידי מודל יסוד מולטי־מודאלי, מספקת את השילוב הטוב ביותר בין דיוק ומהירות, מה שהופך אותה לאטרקטיבית לסריקות וירטואליות רחבות של תרכובות חדשות. הנתיב המפורש שמשחזר מבני גביש מציע זווית מבט מבטיחה נוספת, במיוחד ככל שמפיקי המבנים משתפרים. יחד, שיטות אלה מצביעות לקראת כלי בינה מלאכותית שיכולים למיין במהירות מרחבי כימיה עצומים ולהדגיש את המועמדים המבטיחים עוד לפני שנגדל גביש יחיד.
ציטוט: Rubtsov, I., Dudakov, I., Kuratov, Y. et al. Enhancing composition-based materials property prediction by cross-modal knowledge transfer. Sci Rep 16, 16434 (2026). https://doi.org/10.1038/s41598-026-53182-3
מילות מפתח: אינפורמטיקה של חומרים, מודלי שפה כימיים, חיזוי תכונות, למידה מולטי־מודאלית, מבני גביש