Clear Sky Science · ja

ランダムフォレストと分位回帰フォレストモデルを用いたペンシルベニア州室内ラドン曝露の平均、変動、そして不確実性の定量化

· 一覧に戻る

なぜ見えない家庭用ガスが重要なのか

ラドンは無色無臭の放射性ガスで、地中から住宅に浸入して肺がんのリスクを高めます。とくに非喫煙者にとっての影響が深刻です。多くの地図は郡など広い領域の平均ラドン濃度しか示さないため、家庭や公衆衛生関係者にとって危険なホットスポットが隠れてしまうことがあります。本研究は単純だが重要な問いを投げかけます:近隣の平均リスクだけでなく、住宅ごとにそのリスクがどれほど変わるかを現代のデータツールでどう見える化できるか?

Figure 1. 州全体の地図から、どの近隣が住宅内で危険なラドンを抱えやすいかを示すスマートなモデルへ。
Figure 1. 州全体の地図から、どの近隣が住宅内で危険なラドンを抱えやすいかを示すスマートなモデルへ。

郡別地図より細かく見る

研究者たちは高ラドンで知られるペンシルベニア州に着目し、2008年から2021年に収集された160万件以上の室内ラドン検査を調査しました。厳格な品質チェックを経て、約71万8千件の検査結果を1,500を超える郵便区画から分析しました。郡の平均で止まらず、実際のコミュニティに近い郵便番号タブレーションエリア(ZCTA)規模で作業しました。ラドンデータに、土壌や地質、水文、気象、住宅に関する60種以上の情報――土壌タイプ、標高、気温、暖房方式など――を組み合わせました。

地形を読み取るスマートモデル

この豊富なデータを解釈するために、チームはランダムフォレストと分位回帰フォレストという機械学習手法を用いました。これらの方法は多数の変数を同時に見てパターンを探し、土壌や岩盤、気候、建物特性の組み合わせがラドン濃度とどう関連するかを学習します。あるモデルは各郵便区画の典型的・平均的なラドン濃度を推定しました。別のモデルは区画内でラドンがどれほど変動するかを捉えました。三つ目のモデルは中央値だけでなく、75パーセンタイルや90パーセンタイルのような上位側も予測し、異常に高い測定値を示す住宅を特定しました。

コミュニティのラドン分布を形作る要因

モデルは、地域の平均ラドン濃度が地中のガス移動のしやすさ(透水性)と強く結びついていることを示しました。飽和時透水係数のような関連指標も同様に重要でした。より透過性の高い土壌の地域は平均的に室内ラドン濃度が高くなる傾向がありました。暖房用燃料も影響を持ち、薪や石炭などを多く使う地域ではラドンが高めで、都市部を反映する可能性のある都市ガス利用の多い地域は低めの傾向がありました。一方で、住宅ごとの変動を生む要因は平均を押し上げる要因とは必ずしも一致しません。高い変動性は、同一郵便区画内で標高、土壌中の水の移動、気温、土壌排水性などの特性が大きくばらつく場所で最も一般的でした。

「中程度」の地域に隠れたホットスポット

重要なのは、分位回帰フォレストの結果、一見平均が穏やかなコミュニティでも多くの住宅が非常に高い濃度を示すことがあると分かった点です。典型的な値が米国環境保護庁(EPA)の行動指針以下であっても、予測される90パーセンタイルははるかに上回ることがあります。実務的には、郵便番号の平均だけを見るのは誤解を招く可能性があるということです。帳面上は安全そうに見える近隣でも、危険なラドン濃度の住宅が多数隠れていることがあります。ラドン分布の上位を推定することで、大多数の住戸が推奨上限を超える可能性のある郵便区画を特定し、検査と対策の優先順位付けに役立ちます。

Figure 2. 土壌、気象、住宅特性がどのようにモデルに取り込まれ、近隣よりもはるかに高いラドン濃度を示す住宅を見つけるか。
Figure 2. 土壌、気象、住宅特性がどのようにモデルに取り込まれ、近隣よりもはるかに高いラドン濃度を示す住宅を見つけるか。

家族と計画担当者にとっての意義

一般住民にとっての主な教訓は、地域の平均が低いことが各家庭のラドン濃度が低いことを保証しないという点です。公衆衛生の計画担当者にとっては、新しいモデリング手法が平均が高く変動も大きい地域、あるいは平均は中程度でも極端な例外が多い地域を特定する手段を提供し、検査キャンペーンや対策資源の配分をより効果的に行えるようにします。複数の機械学習モデルと細密な環境データを組み合わせることで、本研究は粗い郡単位の地図を越え、室内ラドンリスクのより詳細で現実的な像を提示し、どこで検査し保護を集中すべきかについて賢明な判断を支えます。

引用: Lee, H., Maguire, D., Logan, J. et al. Quantifying mean, variability, and uncertainty in indoor radon exposure in Pennsylvania using random forest and quantile regression forest models. Sci Rep 16, 15192 (2026). https://doi.org/10.1038/s41598-026-37891-3

キーワード: 室内ラドン, 環境健康, 機械学習, 地理空間マッピング, 肺がんリスク