Clear Sky Science · ja
機械学習に基づくプロテオゲノミクスデータのモデリングが肺がんの早期発見のための循環血漿バイオマーカーを同定する
この研究が重要な理由
肺がんは世界で最も多くの命を奪うがんであり、その主な理由は通常発見が遅れることにあります。現在のスクリーニング手法は主に喫煙量の多い人に焦点を当て、画像検査に依存しており、初期の病変を見逃すことがあります。本研究は単純だが力強い問いを投げかけます。症状が現れる何年も前に採取された日常的な血液検体から、静かに肺がんに向かっている人を見分けられるでしょうか。研究者たちは、遺伝情報と数千種類の血中タンパク質、そして最新の機械学習を組み合わせることで、いつかスクリーニングの対象を広げ命を救う可能性のある早期警告信号を探します。
遺伝子と血液に手がかりを探す
まず研究チームは、英国とフィンランドの大規模な人口バイオバンクに登録された何十万人もの人々のDNAを解析しました。肺がんを発症した人々の遺伝情報を発症しなかった人々と比較し、リスク増大に関連するDNA領域を特定しました。次に、同じ遺伝的変化が血中を循環する特定のタンパク質の差異と結びついているかどうかを調べました。タンパク質は体の主働分子であり、その量の変化は腫瘍が画像に現れるずっと前に生じる生物学的ストレスを示すことがあります。リスク遺伝子と血中タンパク質レベルを結びつけることで、遺伝的素因が肺がんへの進展過程でどのように体内の化学状態を微妙に変えるかを地図化し始めました。

診断の何年も前から血中シグナルを追う
研究の第二の補完的な部分は、疾患の早期シグナルとして血中タンパク質に直接焦点を当てました。高スループットプラットフォームを用いて、英国バイオバンクの2万6千人超のボランティアからの血液サンプルで約3,000種類近いタンパク質を測定しました。採血時点で既に肺がんと診断されていた人もいましたが、多くは何年も後に疾患を発症しました。研究者たちはこれらの「将来の患者」を、診断までの期間に基づいて0–4年、5–9年、あるいは採血後0–9年の範囲でグループ化しました。各グループとがんのない参加者の間でタンパク質レベルを比較し、診断よりずっと前から一貫して差異を示すタンパク質を見つけ出しました。
ハイリスクプロファイルを見抜くためにコンピュータを教育する
単一のタンパク質では全体像が語れなかったため、研究チームは数百のマーカーにわたる複雑なパターンを解釈するために機械学習に頼りました。ランダムフォレストやニューラルネットワークなど複数のアルゴリズムを訓練し、血中タンパク質プロファイルのみを用いて将来肺がんを発症する人と発症しない人を区別させました。モデルは良好に機能し、診断の最大9年前に採取されたサンプルを用いてもAUCで約0.8–0.88の精度を示しました。注目すべきは、タンパク質データから構築されたモデルが、年齢、性別、喫煙歴など標準的なリスク要因のみを用いたモデルを明確に上回り、血中シグナルが臨床上既に知られている情報を超えて有意な情報を付加することを示した点です。

主要なタンパク質が示すもの
異なる時間窓にわたり、研究者たちは将来の肺がんと強く関連するコアな22種類のタンパク質を繰り返し特定しました。そのうち14は以前から肺がんと関連づけられており、8つは新たな候補として浮上しました。多くのタンパク質は免疫応答、炎症、肺組織の線維化プロセスに関与しており、早期の肺がんが画像で確認されるずっと前に体の防御システムを変化させる可能性を示唆しています。採血が診断の5–9年前であった人々では、いくつかのタンパク質の高値ががん発症後の予後不良とも結びついており、同じ早期マーカーが将来の腫瘍の侵襲性についての情報を含む可能性を示唆しています。
患者にとっての意味
この研究はまだすぐに使える血液検査を提供するものではなく、これらのタンパク質が肺がんを引き起こすことを証明するものでもありません。代わりに、診断に至る数年間に遺伝子と血中化学がどのように変化するかの詳細な地図を提供し、早期警告マーカーとしてさらに詳しく調べる価値のある特定の循環タンパク質を浮き彫りにします。将来の研究でこれらの知見が確認・精緻化されれば、単純な採血が症状が出る何年も前に高リスク個人(生涯非喫煙者を含む)を特定し、より適時な画像検査や綿密な経過観察につなげ、最終的により多くの命を救う手段になる可能性があります。
引用: Johnson, M.A., Nieves-Rodriguez, S., Hou, L. et al. Machine learning-based proteogenomic data modeling identifies circulating plasma biomarkers for early detection of lung cancer. Commun Med 6, 253 (2026). https://doi.org/10.1038/s43856-026-01500-1
キーワード: 肺がん, 血中バイオマーカー, プロテオミクス, 遺伝的リスク, 早期発見