Clear Sky Science · ja

材料科学のためのマルチモーダル大規模言語モデル

· 一覧に戻る

日常生活にとって新しい材料が重要な理由

より性能の高いスマホ電池、効率的な太陽電池、より高速なコンピュータなど、将来の多くの技術は新しい材料の発見と最適化に依存しています。しかし、原子の組み合わせがどのような特性をもたらすかを見つけることは、宇宙規模の干し草の山から針を探すようなものです。本稿はMatterChatを紹介します。これは科学者と日常語で対話しつつ、材料の原子配列を「視覚的に」把握して挙動を予測し、実験室での合成方法を助けるよう設計された人工知能システムです。

Figure 1
Figure 1.

原子を見て言葉を読むデジタルアシスタント

MatterChatは、まったく異なる二種類の情報を結びつけるように設計されています:固体中の原子の精密な三次元配置と、科学者が使うテキストベースの質問や知識です。一方では、結晶構造を原子と結合のネットワークとして取り込み、何十万もの既知材料で学習した物理志向の強力なモデルを通して各原子とその周囲のコンパクトな数値的フィンガープリントを作り出します。他方では、オープンソースのMistral 7Bを基にした大規模言語モデルが、安定性や電子特性についての質問などユーザーの問いを内部表現に変換します。特別に設計された“ブリッジ”モジュールがこれら二つの世界を整合させ、言語モデルが原子の振る舞いについて直接推論できるように学習します。

豊富な材料カタログでシステムを教育する

MatterChatを訓練するために、著者らはMaterials Projectの142,899件の無機材料を含む大規模データベースを利用しました。各材料について、完全な原子構造だけでなく十二種類の記述情報も用いました。これには化学式、対称性タイプ、結晶族といった基本的な識別子から、金属性か絶縁体か、電子バンドギャップ、磁性挙動、そして熱力学的安定性のいくつかの指標までの九つの主要な物性が含まれます。各構造をこれらの物性に関する多数のテキスト形式の質問と回答と組み合わせることで、システムは原子配列のパターンと科学者が材料を記述・解析する際に用いる言葉との接続を学びました。

単なる照会から科学的推論へ

訓練後、MatterChatはデータベースの記載を繰り返すだけではありません。ユーザーが構造を提供すると、化学式の同定、実験室でその材料が存在しうるかの推測、あるいは通常は重い量子力学計算を要するエネルギーの推定など、幅広い質問に答えられます。著者らはMatterChatが特定の材料について安定性、電子ギャップ、磁性に関する詳しい評価を出す例を示しています。場合によってはさらに踏み込み、窒化ガリウムやイットリウム鉄ガーネットのような既知化合物を作るためのもっともらしい段階的な実験手順を生成することもあり、これは言語モデルに蓄えられた一般的な科学知識を活用しつつ、与えられた結晶構造に基づいて回答を根拠付けています。

Figure 2
Figure 2.

数値に強い汎用チャットボットを上回る性能

注目すべき結果は、MatterChatが定量的な材料特性の予測において、従来の言語モデルやいくつかの物理ベースの機械学習ツールより優れている点です。九つのベンチマーク課題全体で、例えば固体が金属性か安定か磁性かを判断する精度が高く、形成エネルギーやバンドギャップのような連続量に対する予測は、負荷の高い計算機シミュレーションから得られた値により近い結果を示します。これは、訓練に用いられなかったGNoMEプロジェクトの新たに発見された化合物の別集合でテストした場合でも当てはまります。著者らはまたシステム内部の表現を解析し、類似した構造がクラスタを形成し、安定性の変化が内部マップ上で滑らかに追跡されることを示しており、モデルが化学的に意味のあるパターンを学習していることを示唆します。

新材料発見にとっての意義

専門外の読者にとっての主な要点は、MatterChatは科学的言語を理解すると同時に固体中の原子配列を詳細に把握する会話相手のように振る舞う、ということです。これらの能力を融合することで、かつては専門家の直感や高価な計算を要した問いに素早く答え、有望候補の現実的な合成ルートを提案できます。著者らはシステムが極めて精密な数値にはまだ苦労し、時に過度に自信を持って推測することがあると述べていますが、そのモジュール設計と高い性能は、科学者が膨大な可能性空間を探索するのを助け、アイデアから実用技術への道を加速するAIツールに向けた重要な一歩であると主張しています。

引用: Tang, Y., Xu, W., Cao, J. et al. A multimodal large language model for materials science. Nat Mach Intell 8, 588–601 (2026). https://doi.org/10.1038/s42256-026-01214-y

キーワード: 材料探索, マルチモーダルAI, 結晶構造, 物性予測, 科学用チャットボット