Clear Sky Science · ja
未観測座位における2つの対立遺伝子の状態一致確率を観測座位から予測する—牛集団における解析
家系図だけではもはや不十分な理由
現代の牛の育種は、健康で生産性の高い個体を生み出すために適切な親を選ぶことに依存しています。生殖能力、成長、病気への抵抗性に悪影響を及ぼす近親交配を避けるために、1世紀以上にわたり育種家は家系図(系譜)を用いてきました。しかし系譜はしばしば不完全で誤りを含み、個体間の類似性を推定するにすぎません。本研究は単純だが重要な問いを投げかけます。紙の記録ではなく直接DNAを見れば、測定していないゲノム領域においても、どの個体が実際に遺伝的に似ているかをより正確に見分けられるでしょうか?
ゲノムに潜む「遺伝的な双子」を探す
研究者たちは「identity by state(状態一致、IBS)」という概念に注目しました。同じ位置の2つの塩基が見た目でまったく同じなら、それらは最近の共通祖先から来たかどうかにかかわらずIBSです。実務では、育種家はSNPと呼ばれるDNAマーカーの一部だけをジェノタイプ決定するため、多くの座位は未観測のまま残ります。研究チームは、観測されたSNPに基づくさまざまな手法が、これら未観測の座位で対立遺伝子が一致する確率をどの程度正しく予測できるか―つまりゲノムに隠れた遺伝的類似性をどれだけ見通せるか―を明らかにしようとしました。

シミュレーション群と実際の牛データ
これを検証するために、著者らは2種類のデータを用いました。まず、世代を重ねた牛集団をシミュレートし、有効集団規模(実際に遺伝子を寄与する個体数)や、親の選択がランダムか推定育種価に基づくかなどの要因を制御しました。大量のSNPを作成し、それを「観測された」マーカーと「未観測」のマーカーに分けました。未観測セットは参照値、すなわちゲノム全体での真の一致確率を提供します。次に、主要な肉用種である黒毛和種の高密度ジェノタイプの実データでも同様の解析を繰り返し、観測マーカーの一部と未観測の参照点の一部を用いました。
系譜スコアとDNAベース指標の比較
研究では、個体内の近親係数や個体間の遺伝的類似性を表す多様なDNAベースの指標を評価しました。ある方法は各SNPを独立に扱い、別の方法は隣接するSNPを長い同一配列の区間(ホモ接合の走行)としてまとめたり、共通祖先から継承された区間をモデル化したりしました。各指標について、未観測座位での参照IBS値とそれがどれだけ強く一致するか(相関を精度の指標として利用)を計算しました。さらに、育種で広く用いられる系譜ベースの近親係数や関係係数とも比較しました。

DNAマーカーは系譜を明確に上回る
シミュレーションと実際の牛集団の双方において、ゲノムベースの指標は未観測IBSの予測で一貫して系譜ベースの指標を上回りました。特に、すべてのSNPについて両対立遺伝子が祖先集団で頻度0.5から始まったと仮定する手法(論文中でFGRMV2およびfGRMV2と呼ばれる)は非常に高い精度を示しました。共通祖先から継承された区間をモデル化するFHBDや、比較的短いホモ接合走行を全ゲノムで数えるFROH4allおよびその個体間対応指標fSEG4といった、長いホモ接合区間に基づく指標も高性能でした。これらの上位指標は、長期にわたる選択圧が加わった場合でも精度を保ち、系譜ベースの推定よりも上昇する近親度をより確実に追跡しました。
育種家と食料安全保障にとっての意義
専門外の方への要点は、系譜だけに頼るよりもDNAを直接見ることで、牛が実際にどれだけ遺伝的に似ているかをはるかに明確に把握できるということです。特定のゲノムベース指標を活用することで、育種家は隠れた近親交配をより良く監視し、遺伝的多様性を保護し、遺伝的進展と長期的な群全体の健康のバランスをとった交配設計を行えます。これは、今日の近親交配抑制だけでなく、新たな疾患や気候変動といった将来の課題に家畜を適応させるための十分な遺伝的バリエーションを維持することにも重要です。
引用: Nagai, R., Honda, T., Satoh, M. et al. Probabilities of two alleles being identity by state at unobserved loci predicted by observed loci in cattle populations. Sci Rep 16, 7454 (2026). https://doi.org/10.1038/s41598-026-37530-x
キーワード: 牛の遺伝学, 近親交配, ゲノム選抜, 遺伝的多様性, SNPマーカー