Clear Sky Science · he

חיזוי המיקרוביום של הקרקע באמצעות למידת מכונה מסורתית ודגמי למידה עמוקה

· חזרה לאינדקס

מדוע היצורים הזעירים שבאדמה חשובים

כל כפית אדמה מכילה עולם שוקק של חיידקים ופטריות שמזינים באופן שקט את ייצור המזון שלנו, מאחסנים פחמן וממחזרים מזינים. עם זאת, עדיין קשה לנבא אילו מיקרובים ימצאו במקומות מסוימים או כיצד יגיבו לשינויי אקלים ושימושי קרקע. המחקר הזה שואל שאלה מעשית: האם ניתן להכשיר מודלים ממוחשבים מודרניים, על בסיס מדידות סביבתיות בסיסיות כמו טמפרטורה, משקעים וכימיה של הקרקע, כדי לחזות באופן אמין את הרכב הקהילות החבויות הללו?

Figure 1
Figure 1.

נתונים גדולים פוגשים את העולם התת-קרקעי

החוקרים התמקדו במיקרוביום הקרקע — הקהילה הגדולה של המיקרואורגניזמים החיים באדמה — וטיפלו בה כמערכת שאפשר לנבא מהסביבה שלה. באמצעות שני מאגרי נתונים ציבוריים גדולים מסקרי קרקע עולמיים ומרשת התצפיות האקולוגיות הלאומית של ארה"ב (NEON), הם אספו מידע על קהילות חיידקים ופטריות לצד מדידות כגון pH של הקרקע, תכולת פחמן וחנקן, אקלים וצמחייה. במקום לעקוב אחרי כל מין ומין, קיבצו את המיקרובים לקטגוריות רחבות יותר: רמות טקסונומיות כמו פיולם, מחלקה, סדרה, משפחה וז׳אנר, וקבוצות פונקציונליות שמתארות מה המיקרובים עושים — למשל מעגלי פחמן או חנקן.

מבחנים של דרכים שונות ללמוד מהנתונים

כדי להפוך מדידות סביבתיות לחיזויים של קומפוזיציית הקהילה, הצוות השווה בין שבע שיטות חישוביות. שש מהן היו שיטות "מסורתיות" נפוצות של למידת מכונה, כולל רגרסיה לינארית, עצי החלטה, יערות אקראיים, גרדיאנט בוסטינג ו-k-שכנים הקרובים. השביעית הייתה דגם למידה עמוקה שנקרא מרקטן רב-שכבתי (multilayer perceptron), סוג של רשת נוירונים. עבור כל מאגר נתונים וכל רמה טקסונומית או פונקציונלית, המודלים הוכשרו על רוב הדגימות ולאחר מכן התבקשו לחזות את השפע היחסי של קבוצות המיקרובים בדגימות אדמה חדשות וטרם נראו. דיוק החיזויים נמדד באמצעות סטטיסטיקה סטנדרטית (R²) שמשקפת כמה מהשונות במציאות המודלים מצליחים להסביר.

Figure 2
Figure 2.

דפוסים בקנה מידה בקהילת הקרקע

עלה דפוס ברור: קל יותר לחזות קבוצות רחבות של מיקרובים מאשר לפרט פרטים עדינים. עבור חיידקים ופטריות כאחד, המודלים בדרך כלל התקיימו בצורה הטובה ביותר ברמות טקסונומיות גבוהות יותר, כגון פיולם ומחלקה, והפכו לפחות מדויקים כאשר ניסו להבחין בקטגוריות קטנות יותר כמו משפחה וז׳אנר. זה מרמז שבעוד שהתמהיל המדויק של מיקרובים קרובים מבחינה גנטית יכול להיות קשה לחזות, המבנה הכולל של הקהילה קשור יותר לסביבה. יוצא דופן נמצא בקבוצות פונקציונליות של חיידקים באחד ממאגרי הנתונים, שם אף אחד מהמודלים לא תפס היטב את הדפוסים — כנראה כי הקטגוריות הפונקציונליות שנבחרו לא השקיפו במלואן את המורכבות האמיתית של תפקידי המיקרובים.

אילו מודלים עבדו הכי טוב ולמה

מבין כל הגישות שנבדקו, שתי שיטות מסורתיות — יער אקראי (random forest) ו-k-שכנים הקרובים — סיפקו באופן עקבי את החיזויים החזקים ביותר. יערות אקראיים הצטיינו ברמות טקסונומיות רחבות יותר, בעוד ש-k-שכנים היה יעיל במיוחד ברמות המפורטות יותר של משפחה וז׳אנר. גרדיאנט בוסטינג שלעיתים השווה או עלה על מודלים אלה, במיוחד עבור קבוצות פונקציונליות של פטריות, אך ביצועיו השתנו יותר מרמה לרמה. באופן מפתיע, רשת הנוירונים של הלמידה העמוקה לעיתים נדירות התעלה על שיטות פשוטות אלה. המחברים טוענים שזה נובע בעיקר מכך שלמידה עמוקה דורשת בדרך כלל הרבה יותר נתוני אימון מאשר כמה מאות עד אלף-אלפיים דגימות הקרקע שעמדו לרשותם כאן. בסך הכל, קהילות של חיידקים היו קלות יותר לחיזוי מאשר של פטריות, ומאגרים עם יותר דגימות הניבו תוצאות טובות יותר.

מה משמעות הדברים לניהול הקרקע

המחקר מראה כי גם עם הנתונים הלקויים של היום, למידת מכונה יכולה כבר לספק תחזיות טובות למדי של קהילות מיקרוביאליות בקרקע ברמות רחבות. זה מעודד למאמצים לנהל קרקעות לחקלאות, שיקום והפחתת שינויי אקלים, כי הוא מצביע על כך שאפשר להשתמש במדידות סביבתיות יחסית פשוטות כדי לצפות שינויים בתמונה הגדולה של העולם התת-קרקעי. יחד עם זאת, הקושי לחזות פרטים ברזולוציה גבוהה וקבוצות פונקציונליות מסוימות מדגיש כמה דברים שאיננו יודעים עדיין על האורגניזמים בקרקע ועל תפקידיהם. יהיו דרושים מאגרי נתונים טובים וגדולים יותר ותיאורים עשירים יותר של פונקציות מיקרוביאליות לפני שלמידה עמוקה וכלים מתקדמים אחרים יוכלו לממש את מלוא הפוטנציאל שלהם בהנחיית כיצד לטפל בקרקע החיה שמתחת לרגלינו.

ציטוט: Aouabed, Z., Therrien, V., Bouaoune, M.A. et al. Soil microbiome prediction using traditional machine learning and deep learning models. Sci Rep 16, 11069 (2026). https://doi.org/10.1038/s41598-026-39537-w

מילות מפתח: מיקרוביום הקרקע, למידת מכונה, חיידקים ופטריות, גרדיאנטים סביבתיים, חיזוי קהילות