Clear Sky Science · zh

使用随机森林和分位数回归森林模型量化宾夕法尼亚州室内氡暴露的均值、变异性与不确定性

· 返回目录

为什么看不见的家中气体很重要

氡是一种无色无味的放射性气体,可从地下渗入住宅并增加肺癌风险,尤其对不吸烟者危害更大。许多地图仅显示县级等大区域的平均氡水平,这会掩盖对家庭和公共卫生官员而言危险的热点。本研究提出了一个看似简单但影响深远的问题:我们如何使用现代数据工具,不仅看到街区的平均风险,还能看清同一街区内房屋间风险的差异?

Figure 1. 从全州地图到智能模型,显示哪些街区更可能在住宅中出现危险氡。
Figure 1. 从全州地图到智能模型,显示哪些街区更可能在住宅中出现危险氡。

比县级地图更细致的观察

研究人员将重点放在以高氡水平著称的宾夕法尼亚州,检视了 2008 至 2021 年间超过 160 万次室内氡检测记录。经过严格质量筛选后,他们分析了来自 1,500 多个邮政编码区约 71.8 万次检测结果。研究没有止步于县级平均值,而是采用更接近实际社区的邮政编码制表区尺度。他们将氡检测数据与 60 多类关于当地地质、土壤、水文、气候和住房的资料结合,如土壤类型、海拔、温度和供暖方式等。

智能模型如何解读地貌与数据

为了从这份丰富的数据中找出规律,团队使用了称为随机森林和分位数回归森林的机器学习方法。这些方法同时在多变量中寻找模式,学习土壤、岩石、气候和建筑特征的组合如何与氡水平相关。一个模型估计每个邮政区的典型或平均氡水平;另一个着重预测区域内氡水平的变异程度;第三个模型不仅预测氡分布的中位数,还估计较高端,如第 75 和第 90 百分位,代表检测值异常高的住宅。

社区中哪些因素塑造氡的分布

模型显示,社区的平均氡水平与气体在地下流动的难易程度密切相关,这一属性称为渗透性(permeability),以及相关的饱和水力传导率等特征。渗透性更强的土壤区域往往具有更高的室内平均氡水平。供暖燃料也有影响:更多依赖木材、煤等燃料的地区通常氡值偏高,而使用管道燃气的地区则倾向于较低值,这可能反映了城乡住房差异。然而,驱动房屋间氡值差异的因素并不总与提高平均值的因素相同。高变异性常见于同一邮政区内海拔、土壤含水运动、温度、土壤排水性及其他土壤特征差异较大的地方。

“中等”地区中的隐蔽热点

关键在于,分位数回归森林模型揭示出一些平均氡水平适中的社区仍包含许多氡浓度极高的住宅。即便典型水平低于美国环境保护署的行动准则,其预测的第 90 百分位值仍可能远高于该准则。换言之,仅看邮政编码的平均值可能具有误导性:纸面上看似安全的街区仍可能隐藏大量危险氡水平的住宅。通过估计氡分布的高端,模型帮助识别出可能有较大比例房屋超出推荐限值的邮政区,从而应优先进行检测和治理。

Figure 2. 土壤、天气和房屋特征如何输入模型,以标记比邻居高得多的氡浓度住宅。
Figure 2. 土壤、天气和房屋特征如何输入模型,以标记比邻居高得多的氡浓度住宅。

这对家庭与规划者意味着什么

对普通居民而言,最重要的结论是社区平均值偏低并不保证任何单一住宅的氡水平也低。对公共卫生规划者来说,这种新的建模方法提供了一种手段,可定位既有高平均水平又有高变异性的地区,或平均水平适中但存在极端个案的地区,从而更有效地针对检测活动和治理资源进行部署。通过结合多种机器学习模型与精细尺度的环境数据,本研究展示了如何超越粗略的县级地图,构建更为细致、现实的室内氡风险图景,支持关于检测与防护重点地点的更明智决策。

引用: Lee, H., Maguire, D., Logan, J. et al. Quantifying mean, variability, and uncertainty in indoor radon exposure in Pennsylvania using random forest and quantile regression forest models. Sci Rep 16, 15192 (2026). https://doi.org/10.1038/s41598-026-37891-3

关键词: 室内氡, 环境健康, 机器学习, 地理空间制图, 肺癌风险