Clear Sky Science · de
Quantifizierung von Mittelwert, Variabilität und Unsicherheit der Innenraum-Radonbelastung in Pennsylvania mittels Random-Forest- und Quantilregressionswald-Modellen
Warum unsichtbares Gas zu Hause wichtig ist
Radon ist ein farb- und geruchloses radioaktives Gas, das aus dem Boden in Häuser eindringen und das Lungenkrebsrisiko erhöhen kann, besonders bei Nichtrauchern. Viele Karten zeigen nur durchschnittliche Radonwerte für große Gebiete wie Counties, wodurch gefährliche Hotspots für Familien und Gesundheitsbehörden verborgen bleiben können. Diese Studie stellt eine einfache Frage mit großen Folgen: Wie können moderne Datentools eingesetzt werden, um nicht nur das durchschnittliche Risiko in einer Nachbarschaft zu sehen, sondern auch, wie stark dieses Risiko von Haus zu Haus variiert?

Genauer als County-Karten
Die Forschenden konzentrierten sich auf Pennsylvania, einen Bundesstaat, der für hohe Radonwerte bekannt ist, und untersuchten mehr als 1,6 Millionen Innenraum-Radonmessungen aus den Jahren 2008 bis 2021. Nach strengen Qualitätsprüfungen analysierten sie etwa 718.000 Tests aus über 1.500 Postleitzahlgebieten. Anstatt bei County-Durchschnitten stehen zu bleiben, arbeiteten sie auf der Ebene der Zip-Code-Tabulation-Areas, die näher an realen Gemeinden liegen. Sie kombinierten die Radondaten mit mehr als 60 Arten von Informationen über lokale Geologie, Boden, Wasser, Wetter und Wohnverhältnisse, etwa Bodentyp, Höhenlage, Temperatur und Heizungsart der Häuser.
Wie intelligente Modelle die Landschaft lesen
Um dieses reichhaltige Datenset zu deuten, nutzte das Team Methoden des maschinellen Lernens, genannt Random Forest und Quantile Regression Forest. Diese Verfahren suchen nach Mustern über viele Variablen zugleich und lernen, wie Kombinationen aus Boden, Gestein, Klima und Gebäudecharakteristika mit Radonwerten zusammenhängen. Ein Modell schätzte den typischen beziehungsweise durchschnittlichen Radonwert in jedem Postgebiet. Ein anderes konzentrierte sich darauf, wie stark die Radonwerte innerhalb eines Gebiets variieren. Ein drittes Modell sagte nicht nur die Mitte der Radonverteilung voraus, sondern auch höhere Enden wie das 75. und 90. Perzentil, die Häuser mit ungewöhnlich hohen Messwerten repräsentieren.
Was Radonmuster in Gemeinden formt
Die Modelle zeigten, dass durchschnittliche Radonwerte in einer Gemeinde stark damit verknüpft sind, wie leicht Gase durch den Boden wandern können — eine Eigenschaft, die als Permeabilität bekannt ist — sowie mit verwandten Merkmalen wie gesättigter hydraulischer Leitfähigkeit. Gebiete mit durchlässigeren Böden tendieren zu höheren durchschnittlichen Innenraum-Radonwerten. Auch das Heizmaterial spielte eine Rolle: Orte, die stärker auf Holz, Kohle oder ähnliche Brennstoffe setzen, hatten oft höhere Radonwerte, während Gebiete mit Gasversorgung tendenziell niedrigere Werte aufwiesen — möglicherweise weil die Brennstoffart Unterschiede zwischen ländlicher und städtischer Bebauung widerspiegelt. Allerdings sind die Faktoren, die die Variation von Haus zu Haus antreiben, nicht dieselben wie diejenigen, die den Durchschnitt erhöhen. Hohe Variabilität war am häufigsten dort, wo Höhenlage, Bodenwasserbewegung, Temperatur, Bodendrainage und andere Bodeneigenschaften innerhalb desselben Postgebiets stark schwankten.
Versteckte Hotspots in „moderaten“ Gebieten
Entscheidend ist, dass das Quantile-Regression-Forest-Modell offenbarte, dass einige Gemeinden mit moderaten Durchschnittswerten dennoch viele Häuser mit sehr hohen Konzentrationen enthalten. Selbst dort, wo der typische Wert unter dem Handlungsrichtwert der US-Umweltschutzbehörde lag, konnte das prognostizierte 90. Perzentil weit darüber liegen. Praktisch bedeutet das: Nur auf den Durchschnitt eines Postleitzahlengebiets zu schauen, kann irreführend sein — ein Viertel, das auf dem Papier sicher wirkt, kann viele Häuser mit gefährlichen Radonwerten verbergen. Durch die Abschätzung des oberen Bereichs der Radonverteilung helfen die Modelle, Postgebiete zu identifizieren, in denen ein großer Anteil der Häuser voraussichtlich empfohlene Grenzwerte überschreitet und deshalb Vorrang bei Tests und Minderungsmaßnahmen haben sollte.

Was das für Familien und Planer bedeutet
Für die Bewohner ist die wichtigste Erkenntnis: Ein niedriger Gemeinde-Durchschnitt garantiert nicht, dass in einem einzelnen Haus ebenfalls niedrige Radonwerte vorliegen. Für Gesundheitsplaner bietet der neue Modellansatz einen Weg, Gebiete zu lokalisieren, die hohe Durchschnittswerte mit hoher Variabilität kombinieren oder moderate Durchschnitte mit extremen Ausreißern, sodass sie Testkampagnen und Minderungsressourcen gezielter einsetzen können. Indem mehrere Modelle des maschinellen Lernens mit feinräumigen Umweltdaten kombiniert werden, zeigt diese Studie, wie wir über grobe County-Karten hinaus zu einem detaillierteren, realistischeren Bild des Innenraum-Radonrisikos gelangen und so klügere Entscheidungen darüber treffen können, wo getestet und wo Schutzmaßnahmen fokussiert werden sollten.
Zitation: Lee, H., Maguire, D., Logan, J. et al. Quantifying mean, variability, and uncertainty in indoor radon exposure in Pennsylvania using random forest and quantile regression forest models. Sci Rep 16, 15192 (2026). https://doi.org/10.1038/s41598-026-37891-3
Schlüsselwörter: Innenraum-Radon, Umweltgesundheit, Maschinelles Lernen, Georäumliche Kartierung, Lungenkrebsrisiko