Clear Sky Science · fr
Quantification de la moyenne, de la variabilité et de l’incertitude de l’exposition au radon intérieur en Pennsylvanie à l’aide de modèles random forest et quantile regression forest
Pourquoi ce gaz invisible à la maison compte
Le radon est un gaz radioactif incolore et inodore qui peut s’infiltrer dans les habitations depuis le sol et augmenter le risque de cancer du poumon, notamment chez les non-fumeurs. De nombreuses cartes montrent uniquement les niveaux moyens de radon pour de vastes zones comme les comtés, ce qui peut masquer des points chauds dangereux pour les familles et les autorités sanitaires. Cette étude pose une question simple aux conséquences importantes : comment utiliser les outils de données modernes pour voir non seulement le risque moyen d’un quartier, mais aussi à quel point ce risque varie d’une maison à l’autre ?

Regarder plus finement que les cartes par comté
Les chercheurs se sont concentrés sur la Pennsylvanie, un État connu pour ses niveaux élevés de radon, et ont examiné plus de 1,6 million de tests de radon intérieurs collectés entre 2008 et 2021. Après des contrôles qualité stricts, ils ont analysé environ 718 000 tests provenant de plus de 1 500 zones de codes postaux. Plutôt que de s’arrêter aux moyennes par comté, ils ont travaillé à l’échelle des zones de tabulation de codes postaux, qui correspondent mieux aux communautés réelles. Ils ont combiné les données de radon avec plus de 60 types d’informations sur la géologie locale, le sol, l’eau, le climat et le bâti, tels que le type de sol, l’altitude, la température et le mode de chauffage des habitations.
Comment les modèles intelligents lisent le paysage
Pour donner du sens à ce riche ensemble de données, l’équipe a utilisé des techniques d’apprentissage automatique appelées random forest et quantile regression forest. Ces méthodes recherchent des motifs à travers de nombreuses variables simultanément, apprenant comment des combinaisons de caractéristiques du sol, de la roche, du climat et du bâtiment se rapportent aux niveaux de radon. Un modèle a estimé le niveau typique ou moyen de radon dans chaque zone postale. Un autre s’est intéressé à la mesure dans laquelle les niveaux de radon varient au sein d’une zone. Un troisième modèle a prédit non seulement la médiane de la distribution du radon mais aussi ses extrémités supérieures, comme les 75e et 90e centiles, qui représentent les logements avec des mesures exceptionnellement élevées.
Ce qui façonne les schémas de radon dans les communautés
Les modèles ont montré que les niveaux moyens de radon d’une communauté sont fortement liés à la facilité de circulation des gaz dans le sol, une propriété connue sous le nom de perméabilité, ainsi qu’à des caractéristiques associées comme la conductivité hydraulique saturée. Les zones avec des sols plus perméables tendent à présenter des niveaux moyens de radon intérieur plus élevés. Le combustible utilisé pour le chauffage importait aussi : les endroits qui dépendent davantage du bois, du charbon ou de combustibles similaires avaient souvent des niveaux de radon plus élevés, tandis que les lieux utilisant le gaz de réseau avaient tendance à afficher des niveaux plus faibles, possiblement parce que le type de combustible reflète des différences entre zones rurales et urbaines. Cependant, les facteurs qui expliquent la variation d’une maison à l’autre ne sont pas les mêmes que ceux qui élèvent la moyenne. Une forte variabilité était surtout fréquente là où l’altitude, le mouvement de l’eau dans le sol, la température, le drainage du sol et d’autres caractéristiques pédologiques variaient beaucoup au sein d’une même zone postale.
Points chauds cachés dans des zones « modérées »
De façon cruciale, le modèle quantile regression forest a révélé que certaines communautés aux niveaux moyens de radon modestes contenaient néanmoins de nombreux logements avec des concentrations très élevées. Même lorsque le niveau typique se situait en dessous de la directive d’action de l’Agence de protection de l’environnement des États-Unis, le 90e centile prédit pouvait se situer bien au-dessus. En termes pratiques, cela signifie que se fier uniquement à la moyenne d’un code postal peut être trompeur : un quartier qui paraît sûr sur le papier peut pourtant cacher de nombreuses maisons avec des niveaux dangereux de radon. En estimant l’extrémité supérieure de la distribution du radon, les modèles aident à identifier les zones postales où une grande part des habitations est susceptible de dépasser les limites recommandées et qui méritent donc la priorité pour les tests et l’atténuation.

Ce que cela signifie pour les familles et les planificateurs
Pour les habitants au quotidien, l’enseignement principal est qu’une faible moyenne communautaire ne garantit pas un bas niveau de radon dans un logement individuel. Pour les responsables de santé publique, la nouvelle approche de modélisation offre un moyen de repérer les zones qui combinent niveaux moyens élevés et forte variabilité, ou moyennes modérées avec des valeurs aberrantes extrêmes, afin de mieux cibler les campagnes de tests et les ressources d’atténuation. En combinant plusieurs modèles d’apprentissage automatique et des données environnementales à fine échelle, cette étude montre comment dépasser les cartes grossières par comté pour obtenir une image plus détaillée et réaliste du risque de radon intérieur, soutenant des décisions plus intelligentes sur les lieux à tester et où concentrer les efforts de protection.
Citation: Lee, H., Maguire, D., Logan, J. et al. Quantifying mean, variability, and uncertainty in indoor radon exposure in Pennsylvania using random forest and quantile regression forest models. Sci Rep 16, 15192 (2026). https://doi.org/10.1038/s41598-026-37891-3
Mots-clés: radon intérieur, santé environnementale, apprentissage automatique, cartographie géospatiale, risque de cancer du poumon