Clear Sky Science · ru

Квантирование среднего, изменчивости и неопределённости воздействия радона в помещениях Пенсильвании с помощью случайного леса и модели квантильной регрессии леса

· Назад к списку

Почему важен невидимый газ в доме

Радон — бесцветный, не имеющий запаха радиоактивный газ, который может проникать в дома из грунта и повышать риск рака лёгких, особенно у некурящих. Многие карты показывают лишь средние уровни радона для крупных территорий, таких как округи, что может скрывать опасные очаги от семей и служб общественного здравоохранения. В этом исследовании поставлен простой вопрос с большими последствиями: как с помощью современных инструментов данных увидеть не только средний риск в районе, но и то, насколько этот риск варьируется от дома к дому?

Figure 1. От карт по всему штату до интеллектуальных моделей, показывающих, в каких районах наибольшая вероятность опасного уровня радона в домах.
Figure 1. От карт по всему штату до интеллектуальных моделей, показывающих, в каких районах наибольшая вероятность опасного уровня радона в домах.

Рассмотрение в более мелкой шкале, чем карты по округам

Исследователи сосредоточились на Пенсильвании, штате, известном высокими уровнями радона, и проанализировали более 1,6 миллиона измерений радона в помещениях, собранных в период с 2008 по 2021 год. После строгой проверки качества они оставили около 718 000 тестов из более чем 1 500 почтовых районов. Вместо того чтобы ограничиваться средними по округам, они работали на уровне почтовых кодов (zip code tabulation areas), которые ближе к реальным сообществам. Данные о радоне были объединены более чем с 60 видами информации о местной геологии, почве, воде, погоде и жилом фонде — например, типом почвы, высотой над уровнем моря, температурой и способом отопления домов.

Как умные модели «читают» ландшафт

Чтобы разобраться в этом богатом наборе данных, команда использовала методы машинного обучения — модели случайного леса и квантильной регрессии леса. Эти методы ищут закономерности среди множества переменных одновременно, выучивая, как сочетания почвенных, горных, погодных и строительных характеристик связаны с уровнями радона. Одна модель оценивала типичный или средний уровень радона в каждом почтовом районе. Другая фокусировалась на том, насколько уровни радона варьируются внутри района. Третья модель предсказывала не только середину диапазона радона, но и верхние его значения, такие как 75-й и 90-й процентили, которые отражают дома с необычно высокими показаниями.

Что формирует картину радона в сообществах

Модели показали, что средние уровни радона в сообществе тесно связаны с тем, насколько легко газы могут перемещаться по грунту — свойством, известным как проницаемость, — а также с сопутствующими характеристиками, такими как насыщенная гидравлическая проводимость. Территории с более проницаемыми почвами, как правило, имеют более высокие средние уровни радона в помещениях. Важным оказался и вид топлива для отопления: в местах, где больше используют дрова, уголь или подобные виды топлива, часто наблюдались более высокие уровни радона, тогда как районы с использованием магистрального газа обычно имели более низкие значения — возможно, потому что тип топлива отражает различия между сельским и городским жильём. Однако факторы, которые объясняют изменчивость от дома к дому, не совпадают с теми, что повышают средний уровень. Высокая изменчивость чаще встречалась там, где внутри одного почтового района сильно различались высота над уровнем моря, движение почвенной воды, температура, дренаж почвы и другие почвенные свойства.

Скрытые очаги в «умеренных» районах

Ключевым оказалось то, что модель квантильной регрессии леса выявила сообщества с умеренными средними уровнями, в которых по-прежнему встречается множество домов с очень высокими концентрациями. Даже там, где типичный уровень был ниже руководящей величины Агентства по охране окружающей среды США, предсказанный 90-й перцентиль мог быть существенно выше её. Практический вывод таков: опираться только на среднее по почтовому коду может вводить в заблуждение — район, кажущийся безопасным на бумаге, может скрывать множество домов с опасными уровнями радона. Оценка верхней части диапазона радона помогает выделять почтовые районы, где значительная доля домов, вероятно, превышает рекомендованные пределы и потому требует приоритетного тестирования и мер по снижению уровня.

Figure 2. Как почва, погода и характеристики жилья питают модель, которая отмечает дома с существенно более высокими уровнями радона по сравнению с соседями.
Figure 2. Как почва, погода и характеристики жилья питают модель, которая отмечает дома с существенно более высокими уровнями радона по сравнению с соседями.

Что это значит для семей и планировщиков

Для обычных жителей главный вывод — низкое среднее по сообществу не гарантирует низкий уровень радона в отдельном доме. Для планировщиков общественного здравоохранения новый подход моделирования предоставляет способ выявлять районы, где сочетаются высокие средние уровни и высокая изменчивость, или умеренные средние с экстремальными выбросами, чтобы эффективнее нацеливать кампании по тестированию и ресурсы на снижение рисков. Комбинируя несколько моделей машинного обучения и детализированные экологические данные, это исследование показывает, как можно выйти за рамки грубых карт по округам и получить более детальную, реалистичную картину риска радона в помещениях, что помогает принимать более обоснованные решения о том, где проводить тестирование и направлять усилия по защите.

Цитирование: Lee, H., Maguire, D., Logan, J. et al. Quantifying mean, variability, and uncertainty in indoor radon exposure in Pennsylvania using random forest and quantile regression forest models. Sci Rep 16, 15192 (2026). https://doi.org/10.1038/s41598-026-37891-3

Ключевые слова: радон в помещениях, экологическое здоровье, машинное обучение, геопространственное картирование, риск рака лёгких