Clear Sky Science · ja
多様なソースからの複数の空間トランスクリプトミクスデータセットを解釈可能かつ柔軟に空間情報を考慮して統合する
組織を生きた地図として見る
生物学者は現在、組織切片上の何千もの小さなスポットでどの遺伝子が活性化しているかを読み取る手法を手にし、臓器や腫瘍、胚を詳細な分子地図へと変換できます。しかし、各実験は異なる機器や設定で行われるため、得られたマップは比較や結合が難しいことが多い。本論文はINSPIREを紹介します。これは多様な遺伝子マップを一つの理解しやすいビューに縫い合わせ、研究者が組織の構築過程、疾病による変化、時間に沿った発達を追跡できるようにする計算手法です。

なぜ多数の遺伝子マップは統合が難しいのか
現代の空間トランスクリプトミクス技術は、遺伝子活動を測定しながら各細胞の組織内の位置を保持します。ある手法はほぼ全遺伝子を捉えますが、各スポットで複数の細胞をぼかしてしまいます。別の手法は単一細胞を特定できますが、対象は選択された遺伝子パネルに限られます。これらのマップは異なる研究室、機器、時点、種から得られるため、それぞれが固有の技術的な癖やノイズをもっています。既存の解析ツールは単一の切片や似た切片数枚を記述することはできても、何十枚もの断面を整列させたり、技術間を橋渡ししたり、共通点と固有の特徴を同時に扱ったりする際にはしばしば失敗します。
組織マップを統一するための新しい枠組み
INSPIREは、遺伝子の読み取り値と細胞の物理的配置の両方を尊重する深層学習の枠組みでこの統合問題に対処します。まず各切片について近傍スポットをつなぐ「近傍グラフ」を構築します。グラフベースのニューラルネットワークが生データを共有の内部表現へ変換し、異なる切片の間で比較可能な細胞を混ぜ合わせつつ、切片固有のパターンを残せるようにします。敵対的な成分は批評家のように働き、この内部空間で切片が十分に重なっていない箇所を見つけ出し、モデルに整合性を改善するよう促します。
隠れたパターンから人が読める特徴へ
データが共有空間に持ち込まれると、INSPIREは残る信号を反復する空間パターンの集合(因子)へ分解します。これは、非負値行列因子分解のステップを用いて、モデルがデータを少数の単純な構成要素の組み合わせとして表現するよう促すことで行われます。各因子は切片全体にわたる空間パターンに対応し、特定の脳層、腫瘍ニッチ、発生中の器官領域などを表します。INSPIREは各因子に最も結びつく遺伝子も学習するため、研究者はこれらのパターンを抽象的な数値ではなく、既知の細胞型や生物学的プロセスの文脈で解釈できます。

実データでINSPIREが明かすこと
著者らは、INSPIREがシミュレーションデータと実データの双方で広く使われる手法群より優れることを示しています。ヒトの大脳皮質スライスでは、ドナー間で層を整列させ、ニューロン型や支持細胞の微妙な違いを回復し、手動ラベルでは見落とされがちな配列も検出しました。マウス脳では、皮質のような共有構造と小脳のような固有領域を明瞭に分離し、それぞれの遺伝子シグネチャを正しく特定しました。INSPIREは異なる技術間も橋渡しし、単一細胞マップと広域サーベイを結合して詳細な層情報を転写したり、直接測定されていなかった遺伝子パターンを推定したりします。
疾患、発生、三次元構造の追跡
健康な組織を超えて、INSPIREは疾病や発生における隠れた変異を露わにします。ヒト乳癌切片(数十万の細胞を含む)では、非浸潤領域と浸潤領域を区別し、それぞれの周囲に存在する支持細胞の異なる亜群を明らかにし、これらは攻撃性や血管新生の既知マーカーと結びついています。マウス胚では、複数段階で取得された切片を統合して時空間アトラスを構築し、心臓、肝臓、肺、脳などの器官がどのように成長し再編成されるかを追跡します。隣接する切片を正確に整列させることで、臓器や胚全体の三次元再構築も支援し、二次元画像の積み重ねを一貫した3Dの遺伝子発現モデルへと変えます。
今後の組織研究にとっての意義
専門外の人にとって、INSPIREは多くの不完全でノイズの多い遺伝子マップを、空間パターンと遺伝子プログラムという共有言語へ変換する強力な翻訳者のように考えられます。組織内での細胞の位置情報を保持し、技術的アーティファクトを除去し、実験間の共通点と固有点の両方を浮き彫りにします。空間トランスクリプトミクスプロジェクトが臓器、腫瘍、生物全体へと拡大するにつれ、INSPIREのような手法は研究者が細胞の協同、疾病による組織構造の破綻、複雑な構造の発生過程を理解するための統合アトラス構築に不可欠となるでしょう。
引用: Zhao, J., Zhang, X., Wang, G. et al. Interpretable, flexible and spatially aware integration of multiple spatial transcriptomics datasets from diverse sources. Nat Genet 58, 1138–1150 (2026). https://doi.org/10.1038/s41588-026-02579-x
キーワード: 空間トランスクリプトミクス, 組織構造, 遺伝子発現マップ, データ統合, 腫瘍微小環境