Clear Sky Science · he

אופטימיזציה של העברה בין תחומים עבור פוטנציאלים בין‑אטומיים אוניברסליים בלמידת מכונה

· חזרה לאינדקס

סימולציות חכמות לחומרים אמיתיים

עיצוב סוללות חדשות, זרזים וחומרים אלקטרוניים מסתמך יותר ויותר על סימולציות מחשב העוקבות אחרי אטומים בתנועה. הסימולציות המהימנות ביותר, המבוססות על מכניקת הקוונטים, מדויקות מאוד אך איטיות מדי כדי לחקור מיליוני מועמדים. מודלים מהירים יותר מבוססי למידת‑מכונה יכולים לחקות חישובי קוונטים, אך לעתים קרובות הם פועלים רק בסביבות צרות — למשל רק גבישים או רק מולקולות. המאמר מציע דרך לבנות מודל אוניברסלי אחד, שנקרא SevenNet‑Omni, שישמור על דיוק במגוון סוגי חומרים, משטחי מתכת ונוזלים מולקולריים ועד מסגרות נקבוביות, ועדיין ירוץ מספיק מהר לגילוי בקנה מידה גדול.

Figure 1
Figure 1.

מדוע המודלים האטומיים של היום מתקשים להסתגל

פוטנציאלים בין‑אטומיים מבוססי למידת‑מכונה מאומנים בדרך כלל על מאגר נתונים יחיד, שנבחר בקפידה: אחד לגבישים אנאורגניים, אחר למולקולות דמויות‑תרופה, ועוד אחד לשטחים קטליטיים. כל מאגר נבנה בהגדרות כימיה קוונטית משלו, ולכן הנופים האנרגטיים היסודיים שונים בדרכים עדינות ולא־ליניאריות. חיבור פשוט של נתונים אלה — אולי על ידי הזזה או קנה מידה של אנרגיות — מוסיף רעש ומוביל למודלים שמתאימים היטב לדומיין שלהם אך נכשלים בתיאור כימיות לא מוכרות או שיטות קוונטיות מעט שונות. כאשר בעיות חומרים מערבבות תחומים, כגון מולקולות שמגיבות על משטחים מוצקים בתמיסה, חוסר היכולת להעביר ידע הופך לגורם מגביל מהותי.

גב משותף עם התמקצעות עדינה

המחברים מתמודדים עם זה באמצעות התייחסות לכל מאגר כ"משימה" נפרדת ברשת עצבית רב‑משימתית אחת. בתוך המודל, קבוצת פרמטרים אחת יוצרת גב משותף, שתופס כללים כלליים של קשירת אטומים, בעוד שפרמטרים קטנים יותר הייעודיים למשימה מכוונים את ההתנהגות עבור מאגרי נתונים מסוימים. ניתוח מתמטי מראה שאם החלקים הייעודיים למשימה גדלים מדי, המודל למעשה זוכר כל מאגר ושוכח כיצד להכליל. כדי למנוע זאת, המחברים מיישמים רגולריזציה סלקטיבית: הם מענישים ישירות פרמטרים ייעודיים למשימה שבאים לידי ביטוי גדל, ואילו משאירים את הגב המשותף חופשי לגדול לפי צורך. זה דוחף את הרשת להסביר כמה שיותר דרך פיזיקה משותפת, תוך שימוש בתיקונים צנועים לכל דומיין.

Figure 2
Figure 2.

גישור בין עולמות רחוקים עם כמה דוגמאות מפתח

אפילו עם רגולריזציה, אזורים מסוימים במרחב הכימי מופיעים רק במאגר אחד, כך שהגב המשותף אינו מקבל הדרכה שם. כדי לפתור זאת, הצוות מציג "קבוצת גישור בין‑תחומית". הם בוחרים בקפידה אחוז זעיר — כערך של אחד מתוך אלף — של קונפיגורציות ממספר מאגרים ומחשבים אותן מחדש בהגדרה קוונטית‑מכנית משותפת. המבנים הגשרים האלה פועלים כמו ביטויים בילינגואליים בספר לימוד של שפה: הם מקיימים חיבור ישיר בין אופן התיאור של שתי שיטות קוונטיות שונות לאותו סצן אטומי. כשמשלבים אותם באימון, הם מהדקים בחוזקה את הקשר בין המשימות, מיושרים את הנופים האנרגטיים בלי צורך בחישוב מחדש שוטף של הכול. מבדקים שיטתיים מראים שרגולריזציה וקבוצת הגישור מחזקים זו את זו ומשפרים ביצועים מעבר למה שכל אחד מהם יכול להשיג לבד.

בנייה ובחינת מנוע אטומי אוניברסלי

בהתבסס על הרעיונות הללו, המחברים מאמנים את SevenNet‑Omni על 15 מערכי נתונים ציבוריים הכוללים כ‑242 מיליון מבני אטומים, המכסים מולקולות, גבישים, זרזים, מסגרות מתכת‑אורגניות ורמות שונות של תיאוריה קוונטית. לאחר מכן הם מבצעים מבחנים הן במצבים מוכרים והן במצבים מאתגרים: יציבות גבישים, גבולות גרעינים במתכות, פגמים בפלדות, מחסומי טורסיה במולקולות דמויות‑תרופה, פרובסקיטים אורגניים‑אי‑אורגניים היברידיים, ספיחה במסגרות נקבוביות הרלוונטיות ללכידת פחמן, ותגובות על משטחים מתכתיים חשובות להמרת מימן ופחמן‑דו‑חמצני. במבחנים אלו, SevenNet‑Omni לעתים קרובות מתאים או עולה על מודלים מתמחים מאומנים לדומיין יחיד, והוא שומר על "דיוק כימי" עבור רבות מהאנרגיות של תגובות וספיחות. הוא גם משחזר במדויק תוצאות של שיטת קוונטים יקרה (r²SCAN) על‑ידי למידת הקשר בין שיטה זו לנתונים זולים ושכיחים יותר.

מה המשמעות של זה לגילוי חומרים חדשים

ללא‑מומחים, המסר המרכזי הוא ש‑SevenNet‑Omni מתנהג בדומה לחוקר ותיק שעבד בתתי‑תחומים רבים. במקום להתאים יתר על המידה לבעיה צרה אחת, הוא לומד עקרונות כימיים רחבים ומיישם אותם בגמישות למצבים חדשים, מלכידת גזים בחומרים נקבוביים ועד תגובות על אלקטרודות מתכתיות. המאמר מראה שזה אפשרי על‑ידי שיתוף מדוד של מידע בין מאגרי נתונים תוך הגבלת הבדלים באופן קל, ובהוספת מספר קטן של דוגמאות "תרגום" נבחרות בין שיטות קוונטיות. ככל שמאגרי נתונים גדולים ומגוונים יותר ממשיכים להופיע, אסטרטגיית אימון זו מציעה מסלול מדרגי לעבר פוטנציאלים אטומיים אמיתיים, מהימנים ואוניברסליים שיכולים להאיץ גילוי ברחבי הכימיה, הפיזיקה ומדעי החומרים.

ציטוט: Kim, J., You, J., Park, Y. et al. Optimizing cross-domain transfer for universal machine learning interatomic potentials. Nat Commun 17, 3432 (2026). https://doi.org/10.1038/s41467-026-70195-8

מילות מפתח: פוטנציאלים בין‑אטומיים בלמידת מכונה, מיצוג חומרים רב‑תחומי, למידת העברה, פוטנציאל אטומי אוניברסלי, גילוי חומרים