Clear Sky Science · ja

物理化学的性質予測のためのNM多項式指標の数学的モデリングと計算

· 一覧に戻る

将来の医薬品にとっての意義

新薬の設計は航空機の設計に似ていて、実際に作る前にその振る舞いを知りたいものです。薬の場合、その振る舞いには揮発しやすさ、水や脂質との混ざりやすさ、体内での移動の仕方などが含まれます。本稿は、精緻に組み立てられた数学が薬の構造のみから多くの物理化学的性質を予測できることを示し、創薬の時間やコスト、試行錯誤を節約する可能性があることを解説します。

Figure 1
Figure 1.

分子からネットワークへ

著者らは薬分子を単なる原子の集合としてではなく、ネットワークとして扱います。この図式では各原子を点、各化学結合を点を結ぶ線として表します。この種の記述はグラフ理論に由来し、ソーシャルメディアの結び付きや送電網などあらゆるネットワークを扱う数学の分野です。化学者たちは何十年も前からこうした「分子グラフ」を用いてきました。グラフの数値的総括(トポロジカル指標)は、例えば沸点や密度など分子の実際の振る舞いとよく対応することが多いからです。

近隣情報を付け加える

従来の指標は通常、各原子に何本の結合が接しているかだけに注目します。本研究のチームはさらに一歩進め、いわゆる近隣M多項式(NM多項式)指標を用います。これらは原子自身の結合数を数えるだけでなく、その近隣原子がどれだけ結び付いているかも要約します。このより豊かな記述は、分子の分岐の度合いや環のつながり方、酸素や窒素原子がどの位置にあるかといった微妙な差を捉えます。これらの特徴は、分子同士の結合の強さ、剛性、電場に対する電子の応答など――重要な物理化学的性質を構成する要素に影響します。

実際の抗がん剤での検証

数学を現実に結び付けるため、著者らはまずミトキサントロンとドキソルビシンというよく知られた二つの抗がん剤についてNM多項式指標を導出します。どちらも化学療法で広く使われる複雑な多環式分子です。詳細な化学構造図を分子グラフに、そこからNM多項式指標へと変換することで、手法がこれらの分子の異なる“サイズ”にわたる構造変化を体系的に追跡することを示しています。さらにこの手順をPythonプログラムで自動化し、隣接行列という形で与えられた分子の結合情報から瞬時に指標の全セットを返すようにして、人為的エラーを最小化し手計算では煩雑な計算を高速化しています。

Figure 2
Figure 2.

分子の指紋を機械に学習させる

次に研究者たちはこれら二つの薬を超えて、アセトアミノフェンやイブプロフェン、いくつかの現代的な標的治療薬を含む45種類の多環式医薬品の広いコレクションに拡張します。各薬について9つのNM多項式指標と、実験的に測定された9つの性質(複雑さ、沸点、蒸発エンタルピー、着火点、モル屈折率、分極率、表面張力、モル体積、屈折率)をまとめます。そして、Linear、Ridge、Lasso、Elastic Netといった回帰モデルを訓練し、指標の組み合わせが各性質にどう対応するかを学習させます。統計的な安全策も徹底しており、冗長な入力の除去、変数の標準化、データの80%に対する反復クロスバリデーション、残り20%の未使用データでの最終モデルの検証を行っています。

数値が示すもの

モデルは、NM多項式指標が分子の詰まり方や相互作用に結び付く性質に特に強いことを示しています。沸点、蒸発エンタルピー、着火点、モル屈折率、分極率、モル体積については、最良モデルが非常に高い相関スコアを達成しており、予測値が実験値をよく追随します。RidgeやElastic Netのような正則化手法が概して良好に働き、モデルに軽い制約を与えることで指標の最も情報量の多い側面に焦点を絞れていることを示唆します。相関のヒートマップは、特に全体的な結合性や“近隣の豊かさ”に関連するいくつかの指標が、45薬剤パネル全体でこれらの性質と強く一貫して整合していることを示します。

限界と改善の余地

すべての性質がうまく予測できるわけではありません。光が物質に入るときの屈折を表す屈折率は手強く、モデルは単純な平均より良い結果を出すのに苦労し、NM多項式指標との相関は弱いままです。表面張力は中程度に捉えられていますが、他の特性ほど強くはありません。これらのギャップは、二次元的な結合情報を超えた、三次元形状や微妙な電子効果といった特徴が振る舞いに影響していることを示唆します。著者らは、将来はNM多項式指標と量子化学的記述子や3D記述子を組み合わせることでこの隔たりを埋められる可能性があると提案しています。

創薬にとっての意味

平たく言えば、本研究は、整然とした高度な数学が分子の静的なスケッチを実験室での振る舞いをかなり正確に予測するツールに変えられることを示しています。沸点の出しやすさ、嵩高さ、電子の応答のしやすさなど多くの重要な性質について、NM多項式アプローチは現代的な回帰手法と組み合わせることで、より単純な指標や小規模データセットを用いた従来法と同等かそれ以上の性能を示します。まだ実験の完全な代替にはなりませんが、グラフベースのフィンガープリントを計算することで主要な物理化学的性質を早期に推定し、実験作業を有望な候補に集中させ、化学空間の探索をより効率化するための迅速なスクリーニング手段を創薬者に提供します。

引用: Tawhari, Q.M., Naeem, M., Koam, A.N.A. et al. Mathematical Modeling and Computation of NM-Polynomial Indices for Physicochemical Properties Prediction. Sci Rep 16, 8136 (2026). https://doi.org/10.1038/s41598-026-39562-9

キーワード: 化学グラフ理論, 薬物性質予測, 分子トポロジー, 化学における機械学習, 物理化学的記述子