Clear Sky Science · ja
従来の機械学習と深層学習モデルを用いた土壌マイクロバイオーム予測
土壌の小さな生命が重要な理由
ひとさじの土には、私たちの食料生産を静かに支え、炭素を貯蔵し、栄養を循環させる細菌や真菌の生きた世界が満ちています。それでも、どの微生物がどこに生息するか、気候や土地利用の変化にどう反応するかを予測するのは依然として難しい課題です。本研究は実用的な疑問を投げかけます:気温、降水量、土壌化学などの基本的な環境測定値を用いて訓練した現代の計算モデルは、これらの隠れた群集の構成を信頼できる形で予測できるでしょうか?

ビッグデータが地下世界に出会う
研究者らは土壌マイクロバイオーム、すなわち土の中に生きる膨大な微生物群集に着目し、それが周囲の環境から予測可能なシステムであるかを検討しました。世界規模の土壌調査と米国の国立生態観測網(NEON)による二つの大規模公開データセットを用い、細菌・真菌群集の情報に加え、土壌pH、炭素・窒素含有量、気候、植生といった測定値を組み合わせました。個々の種を追う代わりに、微生物をより広いカテゴリーにまとめました:門や綱、目、科、属といった分類学的レベルと、炭素や窒素の循環など微生物の働きを表す機能群です。
データから学ぶいくつかの方法を検証
環境測定値を群集構成の予測に変換するために、研究チームは七つの計算モデリング手法を比較しました。六つは線形回帰、決定木、ランダムフォレスト、勾配ブースティング、k近傍法など広く使われる「従来型」機械学習法で、七つ目は多層パーセプトロンと呼ばれる深層学習モデル(ニューラルネットワークの一種)でした。各データセットと各分類学的・機能的レベルについて、モデルはサンプルの大部分で訓練され、見たことのない新しい土壌サンプルに含まれる微生物群集の相対存在量を予測するように求められました。予測精度は、モデルが実世界の変動をどれだけ説明できるかを示す標準的な統計量(R²)で評価されました。

土壌群集に見られるスケール間のパターン
明確な傾向が示されました:微生物の大まかな分類を予測する方が、細かな詳細を予測するよりも容易です。細菌と真菌の両方で、モデルは一般に門や綱のような上位の分類レベルで最も良い性能を示し、科や属といったより小さなカテゴリを識別しようとするにつれて精度が低下しました。これは、近縁の微生物の正確な組成を予測するのは難しい一方で、群集の全体構造は環境とより強く結びついていることを示唆します。例外として、あるデータセットの細菌の機能群では、選ばれた機能カテゴリが微生物の役割の真の複雑さを十分に反映していなかった可能性があり、どのモデルもパターンをうまく捉えられませんでした。
どのモデルが有効だったか、なぜか
検証した全手法の中で、ランダムフォレストとk近傍法という二つの従来型手法が一貫して最も強い予測を示しました。ランダムフォレストは上位の分類レベルで優れ、k近傍法は特に科や属といった詳細レベルで効果的でした。勾配ブースティングは、特に真菌の機能群に対してこれらのモデルに匹敵するか上回ることがありましたが、レベルごとの性能変動は大きめでした。意外なことに、深層学習のニューラルネットワークはこれらのより単純な手法をほとんど上回りませんでした。著者らは、これは主に深層学習が通常、ここで利用可能な数百〜数千件の土壌サンプルよりはるかに多くの訓練データを必要とするためだと論じています。総じて、細菌群集は真菌群集より予測しやすく、サンプル数の多いデータセットほど良い結果が得られました。
土壌管理への含意
本研究は、現在の不完全なデータであっても、機械学習が広いレベルで土壌微生物群集のかなり良好な予測をすでに提供できることを示しています。これは、農業、復元、気候緩和のために土壌を管理する取り組みにとって励みになります。なぜなら、比較的単純な環境測定で地下世界の大局的な変化を予測できる可能性があるからです。同時に、細かな詳細や特定の機能群を予測する難しさは、土壌生物とその役割についてまだ多くの未知があることを浮き彫りにします。深層学習や他の高度な手法がその潜在力を十分に発揮するには、より良く、より大規模なデータセットと、微生物機能のより豊かな記述が必要となるでしょう。
引用: Aouabed, Z., Therrien, V., Bouaoune, M.A. et al. Soil microbiome prediction using traditional machine learning and deep learning models. Sci Rep 16, 11069 (2026). https://doi.org/10.1038/s41598-026-39537-w
キーワード: 土壌マイクロバイオーム, 機械学習, 細菌と真菌, 環境勾配, 群集予測