Clear Sky Science · ja
包括的で解釈可能な単一細胞基盤モデルによる細胞状態の可視化
なぜより賢い細胞地図が重要か
あなたの体のあらゆる組織は、各々が役割と背景を持つ細胞のにぎやかな都市だ。現代の技術は数千の遺伝子の活動を何百万もの個々の細胞で読み取れるが、このデータの洪水は散逸し、欠損が多く、解釈が難しい。本論文はCellVQを紹介する。これは、そうした絡み合った測定を細胞型、細胞状態、薬や遺伝的変化への応答の明確で人間に理解しやすい地図に変換するよう設計された新しい人工知能モデルだ。

単一細胞を読む新しい方法
著者らは単純な発想から出発する:健康と病気を理解するには、各細胞がどの状態にあるかを記述する信頼できる「言語」が必要だ。単一細胞データで訓練された既存のAIモデルは強力だが、現実世界の三つの問題に苦しむ。第一に、多くの遺伝子が沈黙しているように見えるほど測定は極めてスパースだ。第二に、異なる研究室や手法はデータを異なるスケールで出力するため、結果の比較が難しい。第三に、これらモデルの内部動作はしばしば不透明であり、生物学者が求める明確な説明(ただの予測ではない)を制限してしまう。
細胞活動を再利用可能な細胞コードへ変換する
CellVQは6800万細胞で訓練された大規模モデルにより、各細胞のコンパクトな「細胞コード」を学習してこれらの課題に対処する。各細胞を長い生の数値列として表現する代わりに、CellVQは遺伝子活動パターンをエンコーダーと特別なSingle-Cell Discretizationモジュールに通す。このモジュールは類似パターンを共有コードにまとめるため、異なる実験由来でも振る舞いが似ている細胞は関連するコードを持つようになる。同時に、デコーダーは多くのゼロを含むデータに適した統計モデルを用いて欠損した遺伝子活動を再構築することを学ぶ。この訓練戦略により、システムはスパースな測定に対処しつつ遺伝子間の意味のある関係を捉えられるようになる。
生データから有用な予測へ
一度訓練されると、CellVQは追加の微調整なしで多くのタスクに適用できる。モデルは既存手法よりも細胞型をより明確に分離し、より鮮明なクラスタとより正確な自動ラベリングをもたらす。また、起源組織、年齢、性別、疾患状態といった実用的な特性を以前のアプローチより優れて予測する。驚くべきことに、同じ表現は多くの細胞を平均化したバルクサンプルでもうまく機能し、がん細胞の薬物応答の予測や患者や細胞株が特定治療にどれだけ感受性があるかの予測性能を向上させる。

遺伝子と薬剤が細胞をどう変えるかを明らかにする
研究はさらに、遺伝子や薬剤が撹乱されたときにCellVQが因果関係をとらえているかを検証する。個別遺伝子をオフにするデータや組み合わせを変えるデータを使い、CellVQは残りのゲノムが単一細胞分解能でどう応答するかを予測するのに役立ち、しばしば専門化されたモデルに匹敵またはそれを上回ることがある。薬剤曝露については、著者らはCellVQの遺伝子表現を薬構造を読む別モデルと組み合わせ、これらを合わせることで特定化合物で処理された免疫細胞における遺伝子活動の変化を正確に予測する。手法は最も大きく変動する遺伝子を特定でき、薬の作用機序や副作用への手がかりを提供する。
細胞状態の知識グラフを構築する
モデルの内部論理を利用しやすくするため、著者らはCellVQの出力を用いて細胞、遺伝子、組織・疾患ラベル・年齢・性別などの記述的性質を結ぶグラフを構築する軽量アドオンCellVQ-Graphを導入する。このグラフではアテンション重みが各細胞状態にとってどの遺伝子や特徴が重要かを強調する。脳や膵臓のデータに適用すると、システムは微妙な細胞サブタイプを分離し、中間状態を提案し、よく知られたマーカー遺伝子とあまり研究されていない候補の両方を指摘する。さらに、共に変動する傾向にある遺伝子のネットワークを推定し、発生、ストレス応答、炎症を制御する調節回路の理解を深める。
今後の細胞研究にとっての意義
日常語で言えば、CellVQとCellVQ-Graphは細胞の活動を翻訳・地図化する強力なエンジンのように機能し、ノイズの多い測定を共有可能なコードに変換して研究や疾患を越えて比較できるようにする。この成果は、一つのモデルが予測タスクを改善すると同時に、主要なマーカー遺伝子や有力な遺伝子間連携といった明晰な生物学的手がかりを提供できることを示している。現バージョンは主に一種類の分子読み取りに基づいて訓練されているが、著者らはより多くのデータ型へ拡張し、時間・組織・治療下で細胞がどう変化するかの統一的で解釈可能なアトラスを目指している。
引用: Wang, J., Tan, C., Gao, Z. et al. Illuminating cell states by a comprehensive and interpretable single cell foundation model. Nat Commun 17, 4037 (2026). https://doi.org/10.1038/s41467-026-70071-5
キーワード: 単一細胞RNAシーケンシング, 細胞状態, 基盤モデル, 遺伝子制御, 薬剤応答