Clear Sky Science · ja

固形腫瘍の発生率予測と放射線リスク評価のための深層学習

· 一覧に戻る

日常生活にとってなぜ重要か

私たちは医療検査、航空機搭乗、環境などから低線量の放射線に常時さらされています。規制当局は、この放射線ががん発症の確率をどれだけ高めるかを推定するためにモデルを用いています。本研究は、現代の人工知能、特に深層学習が、数十年にわたり安全基準を導いてきた従来の数式と比べてその推定を改善できるかを問います。

Figure 1
Figure 1.

独自の長期ヒトデータセット

研究は、広島と長崎の原爆被爆者10万人超を長期追跡したライフスパン調査に焦点を当てています。各被験者サブグループについて、受けた放射線量、追跡期間、および発生した固形腫瘍の数が分かっています。著者らは年人表(person-year table)を用いて、年齢、被曝時年齢、性別、都市、線量の組合せごとのがん症例数とリスク時間を要約しています。この豊富なデータセットは世界中の放射線防護指針の基盤であり、新たなモデリング手法を試すのに理想的な試験場です。

従来ルールと新しい学習機械

従来、このコホートの放射線リスクはパラメトリックモデルと呼ばれる手法で推定されてきました。これらは線量や年齢などに対するリスクの変化を表す、事前に選んだ数式に依拠します。透明性が高く解釈しやすい一方、選んだ数式が実際のデータのパターンと一致しないと誤りを生むことがあります。これに対し、深層ニューラルネットワークは特定の数式形状を仮定せず、複数の層にわたる結合ユニットを通じて関係をデータから直接学習します。著者らは二つの年齢指標、性別、都市、被爆時の位置、線量の6つの入力を受け取り、年人表の各セルに対する腫瘍発生率を予測するニューラルネットワークを構築しました。

深層学習はがん発生率をどれほど予測できるか?

研究チームは、単純な平均に基づく「ヌル」モデル、標準的な線形モデル、従来のパラメトリック放射線リスクモデル、そして深層ニューラルネットワークの4モデルを比較しました。繰り返し交差検証を用い、いくつかの標準的な誤差指標で性能を評価しました。ニューラルネットワークはすべての指標で最も低い誤差を示しましたが、洗練されたパラメトリックモデルに比べてわずかの改善にとどまりました。両者の高度なモデルは年齢層やほとんどの線量カテゴリで観察された腫瘍発生率にほぼ一致しましたが、非常に高線量や最も高齢の年齢帯ではそれぞれ不一致が大きくなりました。つまり、深層学習は発生腫瘍数の予測という点で最良の従来モデルを劇的に上回るわけではありませんが、同等以上の性能を示し、やや改善することがあり、その代償として計算時間と複雑性が大幅に増すという結果でした。

Figure 2
Figure 2.

放射線リスクの構成に関する異なる見方

より注目すべき違いは、著者らが過剰相対リスク(ERR)を調べたときに現れました。ERRは放射線がベースラインのがんリスクを何倍にするかを表す一般的な尺度です。ニューラルネットワークを用いて、他の要因を一定に保ちながら線量あり・なしで予測される腫瘍率を比較し、各セルのERRを算出しました。ニューラルネットワークとパラメトリックモデルは似た腫瘍数を予測したにもかかわらず、得られたERR値は線量範囲にわたり顕著に異なりました。パラメトリックモデルは一般により高く、より広がりのあるERR推定を示す傾向がありました。その理由を探るために研究者らはSHAP値というゲーム理論に基づく手法を適用し、各入力変数がモデル予測にどれだけ寄与しているかを割り当てました。全体の腫瘍率については、両モデルとも到達年齢、被曝時年齢、線量、性別が最も重要な影響因子であることに同意していました。しかしERRについては、ニューラルネットワークが線量を支配的因子として強調し、年齢の役割は小さく補助的であると示したのに対し、パラメトリックモデルは事前に指定された式の形状のために被曝時年齢や到達年齢により強い役割を割り当てていました。

制約、課題、将来の用途

本研究は、柔軟性はあるものの深層学習が多くの利用者にとって依然「ブラックボックス」であることを強調しています。深層学習は規制当局が慣れ親しんだ「単位線量あたりのリスク増加」のような単純な要約数値を自然には提供せず、要約された年人データを用いる場合に予測の不確実性帯を推定するのは技術的に困難です。モデルは注意深く制御しないとデータの微妙な特異性に過剰適合する可能性があり、従来手法よりはるかに多くの計算資源を必要とします。著者らは、深層学習が優れたパラメトリックモデルに取って代わるべきではないが、有力な補助手段になり得ると主張しています:非線形の隠れたパターンや相互作用を明らかにし、説明や規制が容易な単純なモデルのより良い関数形を示唆することができる、という点です。

放射線安全性にとっての意味

一般読者への要点は、現代のAIツールは主要なヒトデータセットにおける放射線関連のがん率を予測する際に、従来手法と同等かやや改善した結果を出せるということです。しかし、どの因子がより重要かという見え方、特に年齢が放射線リスクをどれだけ強く形作るかについては異なる描像を示す可能性があります。本研究は既存知見をひっくり返すものではなく、モデル選択が線量と年齢の見かけ上の重要性をどのように変え得るかを浮き彫りにし、深層学習と専門家主導の透明なモデルを組み合わせることを求めています。長期的には、このようなハイブリッドアプローチが医療、職場、環境に対するより精緻で信頼できる放射線防護指針を支える可能性があります。

引用: Liu, Z., Nakamizo, T., Misumi, M. et al. Deep learning for incidence rate prediction and radiation risk assessment of solid tumors. Sci Rep 16, 10577 (2026). https://doi.org/10.1038/s41598-026-46756-8

キーワード: 放射線リスク, 深層学習, がん発生率, 原爆被爆者, リスクモデリング