Clear Sky Science · he

חיזוי ותגלית מטבוליטים במכרסמים ומאגרי יונקים בהנחיית מודל שפה כימית

· חזרה לאינדקס

כימיה נסתרת בתוך גופנו

כל טיפה של דם או שתן מכילה אלפי מולקולות זעירות המשקפות מה שאנו אוכלים, איך אנו חיים והאם אנו מחלימים. עם זאת, עבור רוב המולקולות הללו המדענים אינם יודעים את שמותיהן או מה תפקידן. מאמר זה מציג את DeepMet, מערכת בינה מלאכותית שקוראת את ה"שפה" של המולקולות האלה ומנבאת אילו מהן חסרות במפות הכימיה האנושית והחייתית הנוכחיות. על ידי הנחיית ניסויים לעבר המועמדים המבטיחים ביותר, DeepMet מסייעת לחוקרים לחשוף את ה"חומר האפל" הכימי ולהבין טוב יותר איך גופנו פועל.

Figure 1
Figure 1.

מדוע כל כך הרבה מולקולות נותרות לא מזוהות

כלי מדידה מודרניים יכולים לשקלל וליצור טביעת אצבע חלקית של אלפי מולקולות בדגימת רקמה בבת אחת. אבל המרת טביעות אצבע אלה למבנים מדויקים היא משימה קשה. מאגרים קיימים מפרטים מטבוליטים ידועים רבים, ובכל זאת רוב האותות הנראים בדגימות אמיתיות אינם תואמים דבר ברשימות הללו. פער זה מרמז שמפות המטבוליזם הנוכחיות חסרות רכיבים ושמולקולות טבעיות רבות ביונקים לא תוארו מעולם. המחברים שאפו לבנות כלי שלומד ממטבוליטים ידועים ואז מדמיין את החסרים הסבירים ביותר, בדומה לאופן שבו מודלי שפה חוזים מילים סבירות במשפט.

לימוד המכונה את הדקדוק של המטבוליזם

הצוות אימן רשת עצבית בשם DeepMet על כ־2,000 מטבוליטים אנושיים מבוססים, כאשר כל אחד מקודד כמחרוזת קצרה המתארת את מבנהו. לאחר אימון ראשוני על מולקולות דמויות־תרופות כדי ללמוד כללים כימיים כלליים, DeepMet נותח מחדש (fine-tuned) על מאגר המטבוליטים הזה. כאשר ביקשו ממנו לייצר מבנים חדשים, המודל הפיק מולקולות שתפסו את אותם אזורים במרחב הכימי כמו מטבוליטים אמיתיים ואף שחזר סוגים רבים של ריאקציות אנזימטיות מוכרות, למרות שמעולם לא הוסברו לו החוקים הללו במפורש. במילים אחרות, DeepMet נראה כמי שפנמם את ה"דקדוק" הבלתי כתוב שמקשר אבני־בניין בסיסיות כמו סוכרים וחומצות אמינו למולקולות קטנות ביולוגיות ריאליסטיות.

חיזוי אילו מולקולות חדשות ככל הנראה קיימות

החוקרים ואז דגמו מיליארד מועמדים מ־DeepMet וספרו כמה פעמים כל מבנה ייחודי הופיע. מבנים שחזרו לעתים קרובות נטו להראות יותר כמו מטבוליטים ידועים, לשתף עימם ליבות כימיות נפוצות ולהתאים להמרות אנזימטיות סבירות. כדי לבדוק האם מועמדים בתדירות גבוהה אלה תואמים מולקולות אמיתיות, הצוות השווה את תחזיות DeepMet כנגד מטבוליטים שנוספו ל־Human Metabolome Database לאחר סגירת מאגרי הנתונים לאימון המודל. DeepMet כבר ייצר את רוב התגליות המאוחרות האלה ודירג רבות מהן בין המועמדות הסבירות ביותר שלו. מתוך אלפי המבנים בעלי הדירוג הגבוה שנעדרו במאגרי נתונים, המחברים רכשו או סינתזו 80 ובדקו דגימות אנושיות אמיתיות באמצעות ספקטרומטריית מסה. הם אשררו את נוכחותן של מספר מטבוליטים שלא זוהו בעבר, שחלקם היו מולאמים למרות שהוזכרו בספרות קיימת.

Figure 2
Figure 2.

מאותות גולמיים למבנים מוחשיים

DeepMet שימושי גם כאשר שיא לא מזוהה מתגלה בספקטרומטר מסה. בהינתן רק המסה המדויקת של מולקולה מסתורית, המודל יכול לרשום מבנים רבים שישקלו את אותו הדבר ולדרג אותם לפי כמה הם דומים למטבוליטים. בכמעט שליש מהמקרים הנבחנים המוצר הנכון הופיע בראש הרשימה; ברבים נוספים הוא הופיע בין מספר מועמדים מדורגים גבוהים וכלל היה דומה במבנה למועדף של המודל. כדי לצמצם עוד יותר, המחברים שילבו את DeepMet עם תוכנה נפרדת החוזה כיצד כל מועמד יתפרק בספקטרומטר מסה. התאמת תבניות צפויות אלה לספקטרות ניסיוניות אמיתיות הכפילה בקירוב את דיוק הזיהוי. חיפוש במאגרי נתונים ציבוריים גדולים בגישה המשולבת הזו הניב מבנים משוערים עבור רבים מאותות אנונימיים קודמים והצביע על מטבוליטים השונים במחלות, בתזונה ובמצבי מיקרוביום.

מאירים את ה"חומר האפל" הכימי של החיים

על ידי שילוב אינטואיציה כימית שנלמדה מהנתונים עם התאמת תבניות חזקה מול ספקטרות מסה, DeepMet מספק מפת דרכים לגילוי מטבוליטים חדשים באופן ייעודי ומעשי. הוא עדיין אינו יכול לגלות כל מולקולה לא מוכרת — חלק מהמבנים רחוקים מדי מאלו שראה, וחלק מהאיזומרים נותרו בלתי ניתנים להבחנה ללא שיטות מיוחדות. אך המחקר ממחיש שמכשירי בסגנון מודלי שפה יכולים לא רק להמציא מולקולות ריאליסטיות, אלא גם לצפות תרכובות אמיתיות שביולוגים יאמתו לאחר מכן בבעלי חיים ובבני אדם. עבור הקורא הכללי, המסר הוא שבינה מלאכותית יכולה כעת לסייע לכימאים לחשוף באופן שיטתי כימיה נסתרת בגופנו, לחשוף באופן אפשרי סימני ביולוגיה חדשים, לעקוב אחרי קשרי תזונה–מיקרוביום–מארח ולהפוך בהדרגה את ה"חומר האפל" המטבולי של היום לביולוגיה מתועדת של מחר.

ציטוט: Qiang, H., Wang, F., Lu, W. et al. Language model-guided anticipation and discovery of mammalian metabolites. Nature 651, 211–220 (2026). https://doi.org/10.1038/s41586-025-09969-x

מילות מפתח: מטבולומיקה, מודלי שפה כימיים, DeepMet, ספקטרומטריית מסה, חומר אפל מטבולי