Clear Sky Science · he
שיטת למידת מכונה לחיזוי מקדמי אוסמוזה וגזירת מקדמי פעילות במלחי אמוניום אלקילי
כימיקלים יומיומיים עם מורכבות חבויה
מתרככים לבגדים ומרככי שיער ועד מגבונים מחטאים ומשחת פה, משפחה של חומרים הנקראת מלחי אמוניום רבעוניים — שלעיתים מקוצרים כ"קואטים" — מפעילה באופן שקט מוצרים רבים שאנו סומכים עליהם. הם מסייעים להרוג מיקרובים, לרכך בדים ולהאיץ תגובות תעשייתיות. עם זאת, חיזוי מדויק של התנהגותם במים היה מפתיע בין הקשה, מה שמגביל את היעילות בעיצוב תערובות בטוחות וירוקות יותר. המחקר מראה כיצד למידת מכונה מודרנית יכולה ללמוד ממדידות עבר לחזות את ההתנהגות הזאת באופן גמיש ובמקרים רבים בדיוק הגבוה יותר מאשר מודלים מסורתיים.

מדוע המלח האלה חשובים
קואטים הם מולקולות בעלות מטען חיובי המוקפות ב"זנבות" עשירי פחמן. צורה לא שגרתית זו מאפשרת להן למלא מספר תפקידים במקביל: להצמד ללכלוך שמן, להיצמד למשטחים כגון בד או שיער, ולהפריע לממברנות של מיקרובים, מה שהופך אותן למחטאות ומשטפי שטח חזקים. הן משמשות גם כקטליזטורים בהעברת פאזה, פועלות כשיליות שמעבירות יונים תגובתיים מהמים לממיסים דמויי שמן שבהם הם בדרך כלל לא יכנסו. פעולת ההעברה הזו, המתקיימת בגבול בין מים לשמן, יכולה להאיץ באופן דרמטי תגובות כימיות המשמשות בייצור תרופות, פולימרים וכימיקלים עדינים.
מדוע קשה לחזות את התנהגותן
כדי לעצב קואטים חדשים או לכוונן קיימים, כימאים צריכים לדעת כיצד הם מתנהגים בתמיסה — עד כמה הם מתקשרים היטב עם מים ועם יונים מומסים אחרים. שתי מדידות מפתח הן מקדם האוסמוזה, שמשקף כיצד מלחים משפיעים על נטיית המים לעבור דרך ממברנות, ומקדם הפעילות, שתופס כמה "יעיל" סוג מומס לעומת תמיסה אידיאלית, מעורבת לחלוטין. באופן מסורתי, ערכים אלה מתקבלים או באמצעות ניסויים מייגעים או באמצעות מודלים פיזיקליים מורכבים כגון Electrolyte‑NRTL ו‑Extended UNIQUAC, שדורשים פרמטרים מותאמים רבים וקשה להכלילם למולקולות חדשות.
להדריך מחשב לקרוא מולקולות
החוקרים בחרו בדרך שונה: הם שאלו האם מחשב יכול ללמוד את הקשר בין מבנה קואט להתנהגות אוסמוטית ישירות מהנתונים הקיימים. הם אספו 1,654 מדידות של מקדמי אוסמוזה עבור 52 קואטים שונים מתוך הספרות המדעית. כל מולקולה תוארה באמצעות סימול SMILES — ייצוג מחרוזת שמקודד תכונות כגון מספר אטומי פחמן וחמצן, נוכחות טבעות בנזן, הסתעפויות וסוג קבוצת החנקן החיובית, יחד עם היון השלילי הלוואי (כגון כלוריד, ברומיד או ניטראט). התיאורים המבניים הללו, בתוספת ריכוז המלח, שימשו כקלט למספר אלגוריתמים מפוקחים של למידת מכונה שבוצעו בפייתון.
מציאת המנבא האמין ביותר
שבעה אלגוריתמים שונים, כולל רגרסיה ליניארית, עצי החלטה, יערות אקראיים, מכונות וקטור תומך, גרדיאנט בוסטינג, k‑שכנים וקבוצות גאוסיות, אומנו על 70% מהנתונים ונבדקו על 30% הנותרים. הצוות השתמש גם בסכימת אימות מחמירה יותר שבה כל הנתונים עבור מלח אחד הופרו החוצה כדי לבדוק עד כמה המודלים מצליחים לבצע הכללה על תרכובת שלא נראתה כלל. רגרסיה ליניארית הופיעה גרועה, והחמיצה מגמות לא‑ליניאריות חשובות. שיטות מבוססות עץ התאימו היטב לנתוני האימון אך נתנו תחזיות מעט מסולסלות ולא שמרו על דיוק במלחי בדיקה חדשים. מודל התהליך הגאוסי מצא את האיזון הטוב ביותר: הוא סיפק עקומות חלקות והגיוניות מבחינה פיזיקלית עבור מקדמי האוסמוזה והשיג שגיאת אחוז ממוצעת מוחלטת של כ‑5% בסך הכל, תוך שיפור על פני גישות למידת מכונה חלופיות במבחנים הקשים ביותר.

מהתנהגות אוסמוטית למספרי עיצוב שימושיים
לאחר שנבחר המודל הטוב ביותר, המקדמים האוסמוטיים שחזו הומרו למקדמי פעילות באמצעות יחסים תרמודינמיים סטנדרטיים. כאשר מקדמי הפעילות הללו הושוו לערכים הנגזרים מניסויים וממודלים פיזיקליים מבוססים, גישת למידת המכונה לעיתים התאימה או אף עלתה עליהם עבור קואטים בודדים. אף על פי שהשגיאה הממוצעת שלה על כלל החומרים הייתה מעט גבוהה יותר מאשר כמה מודלים ייעודיים, הייתה לה יתרון מרכזי: מכיוון שהיא מונעת על ידי תיאורי מבנה במקום התאמה ספציפית לכל מלח, ניתן ליישמה על קואטים חדשים שמעולם לא נמדדו במעבדה, בתנאי שמבנים אלה דומים לאלה שבערכת האימון.
מה משמעות הדבר למוצרים ולתהליכים
עבור מי שאינו מומחה, המסר הוא שמחשבים יכולים כעת "לקרוא" תיאורים טקסטואליים קומפקטיים של מולקולות, וממהתבניות שלמדו בנתונים קודמים לנבא כיצד יתקשו מולקולות אלה להתנהג במים בדיוק מרשים. זה פותח פתח לסריקה מהירה וזולה יותר של קואטים חדשים לחומרי חיטוי, חומרי ניקוי, מוצרי טיפוח וקטליזטורים תעשייתיים, ללא צורך בניסויים מקיפים עבור כל מועמד. המודל הנוכחי הוא רק שלב ראשון, והמחברים מציינים כי טביעות אצבע מולקולריות עשירות יותר ואלגוריתמים חדשים יכולים לשפר עוד את הביצועים. עם זאת הוא ממחיש כיצד כלים מונחי נתונים יכולים להשלים את הכימיה המסורתית, ולסייע למהנדסים לעצב תערובות יעילות ובטוחות יותר על‑ידי חקירת אפשרויות כימיות שיהיה בלתי‑מעשי לבדוק אחת‑אחת במעבדה.
ציטוט: Chawuthai, R., Murathathunyaluk, S., Saengsuradech, S. et al. A machine learning approach for predicting osmotic coefficients and deriving activity coefficients in alkyl ammonium salts. Sci Rep 16, 5969 (2026). https://doi.org/10.1038/s41598-026-36758-x
מילות מפתח: מלחי אמוניום רבעוניים, קטליזה בהעברת פאזה, מקדמי אוסמוזה, מקדמי פעילות, למידת מכונה בכימיה