Clear Sky Science · he
חיזוי דמיון כימי בין ספקטרות מסה טנדם במצב יוניזציה שונים
מדוע חשוב לקשר נקודות כימיות
כל לגימה של קפה, נשימת אויר או קורס של תרופה משאירה אחריה עקבות כימיים זעירים בגופנו. מכשירים מודרניים יכולים לזהות אלפי מולקולות כאלה בו-זמנית, אך המרת האותות לתובנות ביולוגיות עדיין מסובכת מפתיע. מחקר זה מציג את MS2DeepScore 2.0, כלי מבוסס למידת מכונה שעוזר למדענים לראות איך מולקולות אלה קשורות זו לזו, אפילו כשהאותות נרשמות בדרכים שונות מאוד. בכך הוא מבטיח פירושים מהירים ומלאים יותר של תערובות כימיות מורכבות ברפואה, תזונה ומחקר סביבתי.
שתי דרכים לצפות באותה מולקולה
ספקטרומטריית מסה היא שיטה מרכזית ששוקלת ומפרקת מולקולות כדי לחשוף את זהותן. בניסויים שגרתיים מדענים מדדו לעתים קרובות את אותו הדגימה בשתי מצבים: אחד שמועדף מולקולות טעונות חיובית ואחד שמועדף מולקולות טעונות שלילית. לכל מצב יש את ה״ברקוד״ האופייני של השברים שלו. גם כאשר שתי המדידות מגיעות מאותה מולקולה, הדפוסים המתקבלים עלולים להיראות כה שונים עד ששיטות השוואה מסורתיות נכשלות. כתוצאה מכך חוקרים בדרך כלל מנתחים את שני המצבים בנפרד, בונים שתי מפות מנותקות של הדגימה ומסתכנים בהחמצת קשרים כימיים חשובים.

מערכת לומדת שמגשרת על הפער
MS2DeepScore 2.0 מתמודד עם הפער הזה על ידי למידת דמיון כימי ישירות מספריות גדולות של ספקטרות ידועות. המודל מבוסס על עיצוב של רשת תאומות (twin neural network) שהופך כל דפוס שברים לטביעת אצבע של 500 מספרים, שנקראת הצמדה (embedding). במהלך האימון המערכת נחשפת למאות אלפי דוגמאות משני המצבים — החיובי והשלילי — יחד עם מידת הדמיון האמיתית של המולקולות הבסיסיות. היא מתאימה את עצמה כך שספקטרות ממולקולות קשורות יסתיימו בהצמדות דומות, בין אם נמדדו באותו מצב ובין אם במצבים מנוגדים. הגרסה החדשה מתקדמת מעבר לקודמתה על ידי הזנת מידע נוסף, כגון המסה של המולקולה המקורית ואיזה מצב יוניזציה שימש, ובשילוב סכמת דגימה מאוזנת בקפידה כדי שמערכות יחסיות נדירות אך אינפורמטיביות לא יטבעו מול מערכות שכיחות וחסרות מידע.
מאותתים מפוזרים למפות מאוחדות
לאחר האימון, MS2DeepScore 2.0 יכול להעריך עד כמה כל שתי ספקטרות דומות כימית, כולל זוגות מצב חיובי מול שלילי. המחברים מראים שניבויים אלה מתואמים היטב עם מדדי דמיון מבניים מקובלים, לא רק בתוך כל מצב אלא גם בין המצבים. באמצעות נתונים אמיתיים משתלשת השתן האנושי, הפלזמה הדמית של הדם האנושי וצמח בר אכיל, הם בונים ״רשתות מולקולריות״ שבהן כל ספקטרה היא צומת ודמיון חזוי חזק יוצר חיבור. בניגוד לשיטות ישנות, רשתות אלה משלבות באופן טבעי נתוני מצב חיובי ושלילי למפות קשורות ואחידות. אשכולות שנבדקו על ידי מומחים כוללים, למשל, קבוצות של מולקולות הקשורות לקפאין בשתן שמחוברות בין מצבי יוניזציה ותואמות למסלולים מטבוליים ידועים.
לראות את הנוף הכימי במבט חטוף
רשתות מולקולריות חזקות אך עלולות להסתבך אם כוללים יותר מדי קישורים חלשים. כדי למנוע זאת, המחברים משתמשים בהצמדות של MS2DeepScore ישירות כקואורדינטות בפריסה דו-ממדית שנוצרת באמצעות שיטה בשם UMAP. כל נקודה במפה זו מייצגת ספקטרה אחת, ונקודות קרובות זו לזו תואמות למולקולות שהמודל מחשיב כדומות כימית. ספקטרות מצב חיובי ושלילי של אותו תרכובת, שנראות שונה בעין, לעיתים קרובות מופיעות זו לצד זו במרחב ההצמדה הזה. הצוות גם מאמן מודל נוסף הבוחן כל הצמדה ומעריך עד כמה היא אמינה, מסמן ספקטרות רועשות, לא שלמות או שלא דומות לשום דבר שראו במהלך האימון. הסרת נקודות איכות נמוכה אלה משפרת את הדיוק הכולל והופכת את הוויזואליזציות לאמינות יותר.

הבאת כלים מתקדמים למעבדות יומיות
כדי להבטיח שטכנולוגיה זו תהיה נגישה גם למי שאינם מומחי תכנות, המחברים שילבו את MS2DeepScore 2.0 בתוכנות ספקטרומטריית מסה פופולריות וזמינות בחינם. עם אינטגרציה זו, חוקרים יכולים לזהות מאפיינים, לבנות רשתות מולקולריות שמתעלמות מגבולות מצבי יוניזציה ולחקור את המרחב הכימי שנוצר דרך לוחות מחוונים אינטראקטיביים. הקוד, המודלים המאומנים וערכות הדאטה לדוגמה משותפים באופן פתוח, והמערכת ניתנת לאימון חוזר או לכוונון עדין עבור קטגוריות כימיות מיוחדות.
מה המשמעות לזה עבור תגליות עתידיות
ללא-מומחים, המסר המרכזי הוא ש-MS2DeepScore 2.0 עוזר להפוך מדידות מפורקות ותלויות-מצב לתמונה אחת ברורה ומובנת יותר של המולקולות הנמצאות בדגימה. על ידי קישור אמין של אותות שבעבר חיו בעולמות אנליטיים נפרדים, השיטה מאפשרת למדענים לנצל ספריות ייחוס גדולות בהרבה, להשוות דגימות בצורה שלמה יותר ולמקד את תשומת הלב באשכולות משמעותיים של תרכובות קשורות. חיבורי-על אלה של נתונים צפויים להאיץ את זיהוי הביומרקרים, חומרי תזונה, מוצרים טבעיים וזיהומים, ובסופו של דבר להעמיק את הבנתנו כיצד הכימיה מעצבת בריאות וסביבה.
ציטוט: de Jonge, N.F., Chekmeneva, E., Schmid, R. et al. Cross ionization mode chemical similarity prediction between tandem mass spectra in metabolomics. Nat Commun 17, 2483 (2026). https://doi.org/10.1038/s41467-026-69083-y
מילות מפתח: מטבולומיקה, ספקטרומטריית מסה, למידת מכונה, רשתות מולקולריות, דמיון כימי