Clear Sky Science · he

למידת מכונה פרשנית לעיצוב חומרים תרמואלקטריים עם רשתות קולמוגורוב–ארנולד

· חזרה לאינדקס

להפוך חום לחשמל שימושי

כל יום כמויות עצומות של אנרגיה אובדות כחום פסולת ממנועי רכבים, מפעלים ואפילו ממכשירים אלקטרוניים בצריכה ביתית. חומרים תרמואלקטריים מציעים דרך להמיר חלק מאותו חום ישירות לחשמל, ללא חלקים נעים וללא דלק. אבל מציאת חומרים חדשים היעילים לכך קשה, כי הביצועים שלהם תלויים במספר תכונות אלקטרוניות המקושרות זו בזו. המחקר הזה בוחן סוג חדש של בינה מלאכותית שיכול לא רק לחזות עד כמה חומר טוב, אלא גם להסביר מדוע — ובכך לפתוח נתיב ברור יותר לעיצוב תרכובות תרמואלקטריות טובות יותר.

Figure 1
Figure 1.

למה קשה למצוא חומרים טובים יותר להמרת חום לחשמל

התקנים תרמואלקטריים מסתמכים על חומרים שיכולים לייצר מתח כאשר צד אחד חם והצד השני קר. היעילות שלהם מתמצתת במקדם שנקרא zT, התלוי בשלושה מרכיבים עיקריים: עד כמה נשאי מטען מגיבים לטמפרטורה (מקדם סיבה-ביקוע), כמה בקלות הם נעים (מוליכות חשמלית), וכמה טוב החומר מוליך חום (מוליכות תרמית). שיפור של אחד מהם לעתים מזיק לאחר — למשל, שיפור מוליכות החשמל עשוי גם להגביר את הולכת החום ולפגוע ביעילות. סימולציות מכאניקות קוונטיות מסורתיות, כמו תיאור פונקציונל הצפיפות, יכולות לחזות תכונות אלה ממבנה האטומי, אך הן יקרות מאוד חישובית ולכן אינן מתקיימות על מיליוני חומרים מועמדים.

מודלים חסרי שקיפות והצורך בתובנה

מודלי למידת מכונה הפכו לאחרונה לכלים רבי עוצמה לאמידת תכונות חומרים במהירות על בסיס סימולציות וניסויים קודמים. בעבודה זו הכותבים מתחילים מתיאורים מספריים עשירים של מבני גביש המופקים על ידי מקודד מיוחד בשם "Crystalformer", אשר לוכד כיצד האטומים מסודרים ומתקשרים בגביש. הם מאמנים תחילה רשת עצבית שכבתית סטנדרטית (multilayer perceptron) כדי לחזות שני ערכים מרכזיים: מקדם סיבה-ביקוע והרווח באנרגיה האלקטרוני (band gap), שמשפיע על כמה בקלות יכול חומר לאחסן נשאי מטען ניידים. המודל הזה משיג דיוק גבוה בשתי המשימות על מערך נתונים גדול של כ־15,000 תרכובות. עם זאת, כמו רוב הרשתות העמוקות, הוא מתנהג כקופסה שחורה ומציע מעט הדרכה לגבי אילו תכונות מבניות באמת חשובות או כיצד הן משולבות בשליטה על תגובת התרמואלקטריות.

סוג אחר של רשת עצבית

הרעיון המרכזי במאמר הוא להחליף רשתות לא שקופות ברשתות קולמוגורוב–ארנולד, או KANs. במקום להסתיר את כל המורכבות בתוך אקטיבציות נוירונים, KANs מצמידות פונקציות גמישות ודמויות-עקומה חד־ממדיות לקשרים בין השכבות. מתמטית, עקומות אלה הן ספליינים חלקים המתאימים את עצמם לנתונים, והמודל הכולל ניתן לכתיבה כסכום של פונקציות פשוטות של תיאורי הקלט. לאחר האימון הכותבים מתאימים ביטויים מתמטיים תמציתיים — בנויים מפונקציות מוכרות כמו סינוסים, קוסינוסים ועקומות רוויה חלקות — לאותן ספליינים שנלמדו. כך המודל הופך לנוסחה סימבולית מפורשת שמקשרת בין תיאורי מבנה לפתיחת רווח באנרגיה ולמקדם סיבה-ביקוע, במקום מטרף פרמטרים שאינו שקוף. אף על פי ש-KANs יקרים יותר לאימון, הם משיגים דיוק השווה ואף במקרים מסוימים טוב יותר מה-multilayer perceptron וכמה קווי בסיס של למידת מכונה מהספרות.

Figure 2
Figure 2.

מה המודל לומד על חומרים

על ידי בחינה של המבנה הפנימי של ה-KAN, הכותבים מראים שרק תת־קבוצה מתוך 128 תיאורי המבנה משפיעה בצורה חזקה על כל תכונה. הם מחשבים ציוני שיוך (attribution) כדי לזהות את התיאורים החשובים ביותר ואז גוזרים קישורים חלשים, ומשאירים רשת דלילה וקלה יותר לפרשנות שעדיין חוזה היטב. באמצעות זוגות של תיאורים בדירוג גבוה הם בונים מפות דו־ממדיות שמראות כיצד הרווח באנרגיה החזוי או מקדם סיבה-ביקוע משתנה במרחב התיאורים. מפות אלה מגלות אפקטים חלקים ושיתופיים, שבהם מגמות תנודתיות ורוויה משולבות, ולא חוקים פשוטים של אחד-ל־אחד. מבחינה כימית, המודל מתקשה בעיקר במערכות מורכבות עם קשירה בעלת כיווניות גבוהה או אלקטרונים d ו-f בעלי אינטראקציות חזקות, אך גם שם KANs מפיקים תחזיות יציבות והגיוניות יותר פיזיקלית מאשר המודל הקופסה-שחורה. לדוגמה, הם מייצרים פחות רווחי אנרגיה שליליים לא פיזיקליים ופחות ערכי Seebeck בסימן שגוי.

מניב תחזית לעיצוב מונחה

מכיוון ש-KANs מוציאים ביטויים מפורשים וחלקים במקום רק תחזיות מספריות, ניתן להשתמש בהם לחקור כיצד שינוי בתיאורים הבסיסיים ישנה את הביצועים התרמואלקטריים. אף שהתיאורים האלה עדיין הם כמויות מופשטות הנגזרות ממקודד מבני עמוק, הם מתואמים עם תכונות ממשיות של סידור אטומי וקשירה. משמעות הדבר היא שחוקרים יכולים להשתמש במודל האנליטי של KAN כמפת דרכים: על ידי סריקה אחר אזורים המקושרים למקדם Seebeck גבוה ולרווח באנרגיה מתאים, ניתן לצמצם חומרים מבטיחים ואז לקשר דפוסי תיאורים אלה חזרה למבני גביש מועמדים במסדי נתונים גדולים או בכלי עיצוב גנרטיביים.

מה זה אומר לחומרים בעתיד

לקורא שאינו מומחה, המסר המרכזי הוא שהעבודה הזאת מקרבת אותנו ל"קופסה מזכוכית" בבינה מלאכותית לגילוי חומרים. רשתות קולמוגורוב–ארנולד מתפקדות כמעט כפי שהטובים ביותר של התחזיות הקופסה-שחורה, אך גם מציגות באופן מתמטי כיצד תכונות מבניות של גביש קשורות ליכולתו להמיר חום לחשמל. השילוב של מהירות, דיוק ופרשנות יכול לעזור למדענים לקבל החלטות מושכלות לגבי אילו תרכובות לייצר ולבחון, ואפשר לקצר את הדרך מנתונים גולמיים למכשירים תרמואלקטריים בעולם האמיתי שאוספים חום פסולת ומשפרים את יעילות האנרגיה.

ציטוט: Fronzi, M., Ford, M.J., Nayal, K.S. et al. Interpretable machine learning for thermoelectric materials design with Kolmogorov–Arnold networks. Sci Rep 16, 14146 (2026). https://doi.org/10.1038/s41598-026-44723-x

מילות מפתח: חומרים תרמואלקטריים, למידת מכונה פרשנית, רשתות קולמוגורוב–ארנולד, עיצוב חומרים, מקדם סיבה-ביקוע (Seebeck)