Clear Sky Science · ja

mist: 単一細胞データにおける差次的DNAメチレーション動態を検出する階層ベイズ枠組み

· 一覧に戻る

細胞を形作る記しを追う

体内のすべての細胞は同じDNAを持ちながら、脳細胞や心筋細胞、免疫細胞はまったく異なる振る舞いをします。その一因がDNA上の化学的タグ、たとえばメチル基などで、遺伝子のオン/オフを助けます。新しい技術により、研究者は発生や変化の過程にある何千もの個々の細胞でこれらのタグを読み取れるようになりました。本稿では、そうした大量でノイジーな測定値を、発生や疾患におけるDNAタグの時間的変化を明快に描き出す物語へと変える統計手法「mist」を紹介します。

Figure 1
Figure 1.

DNA上の化学的手がかりを読む

DNAメチレーションは塩基シトシンへの小さな化学付加で、しばしばCpGと呼ばれる部位で起こり、どの遺伝子が活性化されるかを制御する中心的役割を果たします。バルク試料を用いた過去の研究は、メチレーションが老化、ストレス応答、がんに関与し、細胞分裂時に継承され得ることを示してきました。近年、単一細胞DNAメチレーション技術により各細胞ごとのメチレーションを測定できるようになり、バルクでは平均化されて見えなくなる豊かな細胞間差異が明らかになっています。しかしこれらの測定は疎(スパース)でノイズが多く、細胞が「擬似時間」――初期から後期へと並べた推定タイムライン――に沿って連続的にどう変化するかを追う専用の手法はこれまで存在しませんでした。

見えないタイムラインに沿って細胞を追う

多くの現代的な実験では、研究者が別の手法で擬似時間を推定し、個々の細胞を発生や疾患過程を表す経路に沿って配列化します。mistはこの細胞の並びと、遺伝子やプロモーターのような領域ごとにまとめた単一細胞メチレーションデータを出発点とします。次に各遺伝子のメチレーション量を擬似時間に対する滑らかな曲線としてモデル化し、初期と後期で生物学的変動の大きさが異なることを許容します。これは初期の発生段階がしばしば多様で柔軟性が高いのに対し、後期はより安定しているため重要です。これらの特性を階層ベイズ枠組みに組み込むことで、mistは極めてスパースなデータ中の真の生物学的パターンとランダムノイズを切り分けられます。

曲線から主要な遺伝子を見つける

mistが各遺伝子の滑らかなメチレーション軌跡を学習すると、重要な変化を見つけるために単純かつ強力な考え方を用います。それは「曲線間の面積」を測ることです。単一群の細胞内では、遺伝子の軌跡を水平線と比較して擬似時間に沿って大きく変化するものを検出します。二つの群、たとえば二つの脳領域を比較する場合は、二つの軌跡を整列させて全体的にどれだけ離れているかを測り、基礎レベルだけでなく形の違いに注目します。大規模なコンピュータシミュレーションで、mistは一般化加法モデルや標準的な多項式回帰などの広く使われる代替法よりも真のメチレーションパターンを正確に再現し、差次的にメチレーションされた遺伝子をよりよく同定しました。また、擬似時間を無視する別のメチレーション手法よりも優れており、細胞の時間的順序を明示的にモデル化することの価値を示しています。

エピジェネティクスの目で発生を見る

著者らはmistを実際のマルチオミクスデータセットに適用し、これらの統計的優位性が生物学的に何を意味するかを示しました。マウス胚では、mistは心臓発生の調節因子、免疫細胞形成、幹細胞性の喪失など、既知の系譜転換に沿ったメチレーションパターンを示す遺伝子を明らかにしました。発達中のヒト脳組織では、妊娠期から成人期にかけて前頭皮質と海馬で異なる進化を示す遺伝子が明らかになりました。例えば、記憶関連シグナルに中心的な遺伝子は海馬に沿った軌跡でメチレーションが減少し、この領域での活性化の増加と整合します。一方、前頭皮質の成長関連受容体は組織の成熟とともにメチレーションが増加し、成長から長期機能へのシフトを示唆します。これらの発見は、mistがDNA上の微妙な化学変化を細胞同一性や脳回路の大きな変化に結びつけ得ることを示しています。

Figure 2
Figure 2.

今後の研究で重要となる理由

単一細胞におけるDNAメチレーション動態を時間経過で追うための原理的な方法を提供することで、mistはエピゲノム研究のツールキットにおける重要な穴を埋めます。本手法はスパースで比率データであるメチレーションデータに特化して設計されており、細胞が発生したり異なる系譜や組織領域に分岐する際に制御的挙動が変わる遺伝子を浮かび上がらせます。手法は良好な擬似時間推定に依存し、非常に細かいゲノム領域に対しては計算負荷が高くなることがありますが、遺伝子やプロモーター単位では既に実用的であり、オープンソースソフトウェアとして提供されています。専門外の方への主要なメッセージは、mistが巨大でノイジーな単一細胞メチレーションデータセットを、発生、老化、疾患において重要な制御スイッチがいつどこで切り替わるかを示す明瞭な地図へと翻訳する助けになる、ということです。

引用: Duan, D., Ma, W., Tang, W. et al. mist: a hierarchical Bayesian framework for detecting differential DNA methylation dynamics in single-cell data. Nat Commun 17, 3835 (2026). https://doi.org/10.1038/s41467-026-70523-y

キーワード: 単一細胞DNAメチレーション, 擬似時間解析, ベイズモデリング, エピジェネティック制御, 発生軌跡