Clear Sky Science · ja
ポリジェニックスコアの移植性に関する三つの未解決問題
DNAから健康を予測するのが見た目より難しい理由
医師や研究者は、糖尿病、心臓病、喘息などの一般的な疾患リスクを予測するためにDNAに基づく「ポリジェニックスコア」を利用しようと期待を高めています。しかし、こうしたスコアはしばしば、元の研究ボランティア、通常は欧州系の血統に似た人々でのみうまく機能します。本稿は、なぜこれらの予測が異なる遺伝的背景や生活環境を持つ人々に「移動」してもうまく働かないのか、そして遺伝的リスクスコアを医療で公正に使うとは何を意味するのかを問いかけます。
ポリジェニックスコアが約束するもの—そして限界
ポリジェニックスコアは、ゲノム全体に散在する多数の遺伝変異のごく小さな影響を組み合わせて、身長や血圧といった形質を予測する単一の数値を作ります。これらは数十万規模のボランティアを対象にDNAマーカーと形質を結びつける大規模なゲノムワイド関連解析(GWAS)に基づいて構築されます。しかし、そうしたスコアを新しい集団に適用すると、精度は劇的にばらつきます。一般に、元のGWAS参加者と遺伝的または社会的に異なるほど予測は悪化します。これが移植性(portability)問題であり、ある文脈で有効なスコアが別の文脈では誤解を招き、無批判に用いれば健康格差を深める可能性があります。

祖先を超えて見る:遺伝地図上の距離
この問題を探るために、著者らは40万人超の遺伝情報と健康情報を含むUKバイオバンクのデータを用いました。彼らは、主にホワイト・ブリティッシュの大規模集団に基づいて、身長、体重、血球数、コレステロールなど遺伝率の高い15の形質についてポリジェニックスコアを構築しました。次に、遺伝的背景が広範に及ぶ69,500人の参加者群でそれらのスコアの予測性能を検証しました。研究チームは、人々を大まかな祖先カテゴリに割り当てる代わりに、主成分分析に基づく遺伝地図に投影したときに各個人のDNAプロファイルが元のGWAS平均からどれだけ離れているかという連続的な「遺伝的距離」尺度に沿って、個々人を配置しました。
予測力は衰える—しかし単純でも公正でもない
この遺伝的距離尺度に沿って、いくつかの馴染み深いパターンが現れました。例えば身長では、群レベルの予測精度はGWAS集団から遺伝的に遠ざかるほど滑らかに低下しました。しかし、研究者が個人レベルに注目すると、遺伝的距離はその人の形質がどれだけよく予測されたかを説明するのはごく僅かでした。トウンゼンド貧困指数(地域レベルの物的劣勢を示す指標)のような社会経済的指標は、誰が不正確な予測を受けるかを説明するうえで同程度かやや優れていました。言い換えれば、同じ遺伝的距離の範囲内でも社会経済的地位が低い人々は遺伝的予測の精度が低くなりがちであり、スコアの有用性にとってDNAだけでなく社会的文脈が同じくらい重要になり得ることを浮き彫りにしています。
形質ごとに違う歴史、違う答え
すべての形質が同じ挙動を示したわけではありません。体重や体脂肪では、予測精度が中間的な遺伝的距離で実際にピークを示してから低下するという、単純に「遠いほど悪い」というパターンを破る挙動が見られました。白血球数やリンパ球数のような免疫関連の形質は、特に不可解な振る舞いを示しました。これらの形質の一部では、群レベルの予測精度が元のGWASサンプルと遺伝的にそれほど遠くない人々に対してもほとんどゼロに落ちることがありました。著者らは、免疫形質が過去の感染症など急速に変化する進化的圧力によって形作られ、どのDNA変異が重要かが集団間で変わり得ることを示唆しています。この場合、ある集団に基づいて作られたスコアは別の集団ではほとんど無用になるほど遺伝的構造自体が変化している可能性があります。

性能評価の方法で結論がひっくり返ることもある
「良い予測」をどう測るかを変えると状況はさらに複雑になります。従来の多くの研究はR²という一つの統計量に依存しており、これはスコアが集団の形質変動をどれだけ説明するかを示します。著者らは、特に疾患については他の指標が異なる物語を語り得ることを示しています。喘息については、予測の精度(予測された陽性が真の陽性である割合)と検出率(真の陽性をどれだけ見つけるか)はともに遺伝的距離とともに同様に低下しました。しかし2型糖尿病では、精度はほぼ一定にとどまる一方で検出率は距離とともに実際に上昇しました——つまり、スコアはより遺伝的に遠い集団で真の症例のより大きな割合を見つけていたのです。診療現場が高リスク患者を見逃さないことを重視するのか、誤検知を避けることを重視するのかによって、スコアの移植性について逆の結論に至る可能性があります。
DNAスコアを現実で使うとはどういうことか
総じて、本研究はポリジェニックスコアの有用性を広い祖先ラベルや単一の精度数値だけで判断できないと主張します。個々人の予測品質は、微妙な遺伝的類似性のパターン、各形質の進化的歴史、人々が暮らす環境や社会的条件、そしてスコアとその性能指標の選び方という要因の混合に依存します。ポリジェニックスコアを医療で公正かつ効果的に適用するには、細かな遺伝構造を捉える方法、社会的・環境的影響をモデル化する手法、現実の意思決定に合った評価指標を整えることが必要です。それが整うまでは、遺伝的リスクスコアは慎重に用いられるべきであり、うまく機能する人々だけでなく、うまく機能しない人々や文脈にも注意を向けるべきです。
引用: Wang, J.Y., Lin, N., Zietz, M. et al. Three open questions in polygenic score portability. Nat Commun 17, 942 (2026). https://doi.org/10.1038/s41467-026-68565-3
キーワード: ポリジェニックスコア, 遺伝的予測, 健康格差, 遺伝的祖先, 精密医療