Clear Sky Science · ja
誤り訂正符号の表現を通して遺伝暗号の本質的設計原理を解き明かす
DNAの小さな誤りが重要な理由
身体のすべての細胞は、遺伝の文字を機能するタンパク質に変換する極めて信頼性の高い翻訳システムに依存しています。しかしDNAは常にランダムな変化、すなわち突然変異にさらされています。本論文は一見単純な問いを投げかけます。三文字のコドンをアミノ酸に対応させる普遍的な辞書である遺伝暗号自体が、誤り訂正符号のようにそうした誤りの影響を和らげるように巧妙に設計されているのではないか、という問いです。生物学を通信システムとして扱うことで、著者らは遺伝暗号の現在の姿を説明する隠れた設計規則を明らかにします。
遺伝子を通信システムとして見る
デジタル技術では情報はパッケージ化され、雑音のあるチャネルを通って送られ、復号されます。エンジニアは一部のビットが反転しても元のメッセージを復元できるよう冗長性を意図的に加えます。著者らはこの視点を生物学に適用します。ここではコドン(三連のA、C、G、T/U)がチャネル記号であり、アミノ酸が情報単位で、遺伝暗号が復号器の役割を果たします。64個のコドンが20種のアミノ酸と終止信号をコードするため、この対応には本質的な冗長性が含まれます。中心的な考え方は、特定の変異が自然界でどれほど起きるかを詳細に仮定することなく、遺伝暗号がどのような種類の変異に対して最も耐性があるかを“逆設計”することです。

変異に対する誤り階層を構築する
そのために、著者らはFinding Error Hierarchy(FEH)アルゴリズムを導入します。これはコドンレベルで可能なすべての変異パターンを体系的に走査し、これまでの多くの研究が扱ってきた一文字単位の変化をはるかに超えて、三つの位置すべてを変える組み合わせまで含めます。各ヌクレオチド置換パターンについて、FEHは問いを立てます:もしこの種の誤りがすべてのコドンで生じたなら、遺伝暗号はどの程度元のアミノ酸に“復号”し続け、どの程度変化を引き起こすか?アルゴリズムはその後、暗号が特によく扱うパターンから不得手なパターンへと誤りをランク付けし、変異耐性の階層を構築して、暗号が何を守るように設計されているかを明らかにします。
暗号が最も守っているものを発見する
標準遺伝暗号に適用すると、このアルゴリズムは既知の事実をいくつか再確認すると同時に、それらを拡張します。まず、何も起きないこと(変異なし)が最も一般的であり最もよく扱われるケースであることを確認します。また、第三コドン位置の変化は通常第一・第二位置の変化よりも害が小さいこと、同一ヌクレオチド族内の置換である「トランジション」は族をまたぐ「トランスバージョン」よりも許容されやすいことも再確認されます。さらに深く見るために、著者らは情報を圧縮します:正確なアミノ酸を追跡する代わりに、水との相互作用などでグループ化したり、コドン中のA/T対G/Cの比などでまとめたりします。これにより冗長性が高まり、アルゴリズムはより長く詳細な許容変異の階層を引き出せます。

タンパク質とDNAの安定性における隠れた優先事項
多数の異なるアミノ酸グルーピングを検証することで、研究は遺伝暗号によって自然に保持されやすいグルーピングを特定します。目立っているのは二つです。まず疎水性――アミノ酸が水を避ける傾向――が強く守られていることです。タンパク質のコアにある水を嫌う残基が水を好むものに変わるような変異は比較的不利に扱われます。第二に、あるアミノ酸のコドンにおけるA/T対G/CやG/T対A/Cの特定の比率も優先的に維持されます。これらのパターンは同義コドンの配置と、コドンの第二位置が疎水性か親水性かに強く影響するという既知の重要性から生じます。総じて、これらの発見は遺伝暗号がタンパク質構造と特定の核酸パターンの両方を保護するように調整されていることを示唆します。
生命の頑健性にとっての意味
平たく言えば、この研究は遺伝暗号が精巧に作られた誤り訂正スキームのように振る舞うことを示しています:特定のタイプのDNA変化、特にアミノ酸の水に関する性質や主要なヌクレオチド比を保つ変化に対しては遥かに寛容です。FEHアルゴリズムは種固有のデータに依存することなく、この組み込みの保護階層を明らかにする厳密な手段を提供します。これにより、ほとんどすべての生命で同じ遺伝暗号が保存されてきた理由の一端が説明され、変異がDNAからタンパク質へとどのように波及し、なぜ特定の変化が特に重要になり得るかを研究する新たな枠組みが提供されます。
引用: Aharon, A., Polak, P. & Yaari, G. Revealing the inherent design principles of the genetic code via an error correcting code representation. Sci Rep 16, 11035 (2026). https://doi.org/10.1038/s41598-026-39862-0
キーワード: 遺伝暗号, 突然変異の頑健性, 誤り訂正符号, タンパク質構造, 分子進化