Clear Sky Science · pt

Quantificando a média, a variabilidade e a incerteza na exposição ao radônio em ambientes internos na Pensilvânia usando modelos random forest e quantile regression forest

· Voltar ao índice

Por que um gás invisível em casa importa

O radônio é um gás radioativo incolor e inodoro que pode infiltrar-se nas residências a partir do solo e aumentar o risco de câncer de pulmão, especialmente para não fumantes. Muitos mapas mostram apenas níveis médios de radônio para áreas grandes, como condados, o que pode ocultar pontos quentes perigosos para famílias e autoridades de saúde pública. Este estudo faz uma pergunta simples com grandes consequências: como podemos usar ferramentas de dados modernas para ver não apenas o risco médio em um bairro, mas também quanto esse risco varia de casa para casa?

Figure 1. De mapas em nível estadual a modelos inteligentes que mostram quais bairros têm maior probabilidade de abrigar radônio perigoso nas casas.
Figure 1. De mapas em nível estadual a modelos inteligentes que mostram quais bairros têm maior probabilidade de abrigar radônio perigoso nas casas.

Olhando mais de perto que os mapas de condado

Os pesquisadores concentraram-se na Pensilvânia, um estado conhecido por níveis elevados de radônio, e examinaram mais de 1,6 milhão de testes de radônio em ambientes internos coletados entre 2008 e 2021. Após aplicar rigorosos controles de qualidade, analisaram cerca de 718.000 testes de mais de 1.500 áreas de código postal. Em vez de parar nas médias por condado, trabalharam na escala das áreas de tabulação de código postal (zip code tabulation areas), que se aproximam mais das comunidades reais. Combinaram os dados de radônio com mais de 60 tipos de informação sobre geologia local, solo, água, clima e características das habitações, como tipo de solo, elevação, temperatura e modo de aquecimento das residências.

Como modelos inteligentes interpretam a paisagem

Para entender essa rica mistura de dados, a equipe utilizou técnicas de aprendizado de máquina chamadas random forest e quantile regression forest. Esses métodos buscam padrões entre muitas variáveis ao mesmo tempo, aprendendo como combinações de solo, rocha, clima e características dos edifícios se relacionam com os níveis de radônio. Um modelo estimou o nível típico ou médio de radônio em cada área postal. Outro concentrou-se em quanto os níveis de radônio variam dentro de uma área. Um terceiro modelo previu não apenas o centro da faixa de radônio, mas também as extremidades superiores, como os percentis 75 e 90, que representam residências com leituras incomumente altas.

O que molda os padrões de radônio nas comunidades

Os modelos mostraram que os níveis médios de radônio em uma comunidade estão fortemente ligados à facilidade com que gases se movem pelo solo, uma propriedade conhecida como permeabilidade, junto com características correlatas como condutividade hidráulica saturada. Áreas com solo mais permeável tendem a apresentar níveis médios internos de radônio mais altos. O combustível de aquecimento também teve influência: locais que dependem mais de madeira, carvão ou combustíveis semelhantes frequentemente apresentaram níveis maiores, enquanto locais que usam gás encanado tendiam a ter níveis mais baixos, possivelmente porque o tipo de combustível reflete diferenças entre habitações rurais e urbanas. Entretanto, os fatores que impulsionam a variação de casa para casa não são os mesmos que elevam a média. Alta variabilidade ocorreu sobretudo onde elevação, movimento da água no solo, temperatura, drenagem do solo e outras características do solo variavam muito dentro da mesma área postal.

Pontos quentes ocultos em áreas “moderadas”

De forma crucial, o modelo quantile regression forest revelou que algumas comunidades com médias moderadas de radônio ainda continham muitas casas com concentrações muito altas. Mesmo onde o nível típico ficava abaixo da diretriz de ação da Agência de Proteção Ambiental dos EUA, o percentil 90 previsto podia ficar muito acima dessa referência. Em termos práticos, isso significa que olhar apenas a média de um código postal pode ser enganoso: um bairro que parece seguro no papel pode ainda abrigar muitas residências com níveis perigosos de radônio. Ao estimar a extremidade superior da faixa de radônio, os modelos ajudam a identificar áreas postais onde uma grande parcela de casas provavelmente excede os limites recomendados e, portanto, merece prioridade para testes e mitigação.

Figure 2. Como solo, clima e características das habitações alimentam um modelo que sinaliza residências com níveis de radônio muito superiores aos dos vizinhos.
Figure 2. Como solo, clima e características das habitações alimentam um modelo que sinaliza residências com níveis de radônio muito superiores aos dos vizinhos.

O que isso significa para famílias e planejadores

Para os moradores comuns, a principal conclusão é que uma média baixa na comunidade não garante um nível baixo de radônio em qualquer residência individual. Para os planejadores de saúde pública, a nova abordagem de modelagem oferece uma maneira de identificar áreas que combinam altas médias com alta variabilidade, ou médias moderadas com valores extremos, para que possam direcionar melhor campanhas de testagem e recursos de mitigação. Ao combinar vários modelos de aprendizado de máquina e dados ambientais em escala fina, este estudo mostra como podemos ir além dos mapas grosseiros por condado em direção a uma imagem mais detalhada e realista do risco de radônio em ambientes internos, apoiando decisões mais inteligentes sobre onde testar e onde concentrar os esforços de proteção.

Citação: Lee, H., Maguire, D., Logan, J. et al. Quantifying mean, variability, and uncertainty in indoor radon exposure in Pennsylvania using random forest and quantile regression forest models. Sci Rep 16, 15192 (2026). https://doi.org/10.1038/s41598-026-37891-3

Palavras-chave: radônio interior, saúde ambiental, aprendizado de máquina, mapeamento geoespacial, risco de câncer de pulmão