five

Radon Exposure Dataset

收藏
arXiv2025-05-14 更新2025-05-20 收录
下载链接:
http://arxiv.org/abs/2505.09489v1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集为美国宾夕法尼亚州和犹他州创建了一个全面的、州级的数据集,旨在用于预测和建模家庭氡浓度。数据集整合了地质和人口统计学因素,包括温度、地球化学和土壤特性等。通过分析家庭取暖燃料的使用、建筑年龄和住房类型等人口统计数据,该数据集为评估潜在的高氡水平地区提供了宝贵信息。数据集为两项其他研究提供了基础资源,并采用了一种新颖的方法来预测潜在的氡暴露风险。

This dataset is a comprehensive, state-level resource developed for the U.S. states of Pennsylvania and Utah, targeting the prediction and modeling of residential radon concentrations. It integrates geological and demographic factors, including temperature, geochemical properties, soil characteristics, and other relevant variables. By analyzing demographic data such as residential heating fuel usage, building age, and housing type, this dataset provides valuable information for assessing regions with potentially elevated radon levels. It has served as a foundational resource for two other studies, and employs a novel approach to predicting potential radon exposure risks.
提供机构:
橡树岭国家实验室, 乔治亚理工学院
创建时间:
2025-05-14
搜集汇总
数据集介绍
main_image_url
构建方式
Radon Exposure Dataset的构建采用了多源数据融合的方法,整合了美国社区调查(ACS5)和十年一度的人口普查(DEC)数据,覆盖了宾夕法尼亚州和犹他州的区块组及ZCTA级别信息。通过PySAL Tobler库的area_interpolate()函数,将区块组数据转换为H3格式,确保了空间分辨率的一致性。此外,土壤和地质数据来自美国农业部的gNATSGO数据库,结合了30个与氡水平相关的变量,如土壤密度、组成和水分保持能力。气象数据则源自Daymet数据集,涵盖了日降水量、雪水当量等关键参数,进一步丰富了数据集的维度。
特点
该数据集以其高分辨率和多维度整合著称,特别关注了家庭氡浓度的预测。通过融合地质、土壤、水文和气象数据,提供了从ZCTA到亚公里级别的空间分析能力。数据集还包含了丰富的人口统计学变量,如家庭收入、建筑年龄和供暖燃料类型,为识别高风险人群提供了依据。其独特的H3格式转换和环形平滑技术确保了数据的空间连续性和完整性,适用于精细化的环境健康研究。
使用方法
Radon Exposure Dataset的使用需结合地理信息系统(GIS)工具和统计分析软件。研究人员可通过H3格式的hexagon单元进行空间聚合,利用PySAL Tobler库进行区域插值,填补缺失数据。数据集适用于氡暴露风险的建模与预测,支持从微观到宏观的多尺度分析。例如,通过整合土壤特性与人口数据,可识别高风险社区;结合气象变量,可评估季节性氡浓度变化。数据集的开放性和标准化处理流程,使其可扩展至美国其他地区的研究。
背景与挑战
背景概述
Radon Exposure Dataset是由Oak Ridge National Laboratory和Georgia Institute of Technology的研究团队于2025年创建的高分辨率数据集,旨在解决家庭氡气浓度建模与预测的核心问题。氡气暴露是导致肺癌的主要环境因素之一,尤其在宾夕法尼亚州和犹他州等高风险地区。该数据集整合了地质、土壤、水文、气象及人口普查等多源异构数据,通过Zip Code Tabulation Area (ZCTA)和亚公里级空间尺度,为识别高风险人群提供了科学依据。其创新性在于首次将地质物理参数与人口统计学变量协同分析,为公共卫生决策和辐射暴露研究提供了标准化框架。
当前挑战
该数据集面临两大挑战:领域问题方面,氡气浓度受地质构造、土壤渗透性、建筑特征等多因素非线性影响,现有模型难以准确量化其交互作用;数据构建方面,多源数据(如美国社区调查、地质勘探数据)存在时空分辨率不一致、变量定义差异(如2000年与2010年人口普查表结构变化),需通过复杂的数据融合技术(如H3地理网格系统、PySAL空间插值)实现标准化。此外,土壤矿物学数据的RGB编码转换与缺失值填补(如环形平滑算法)也增加了数据处理的复杂度。
常用场景
经典使用场景
Radon Exposure Dataset 作为一项高分辨率的地理空间数据集,其经典使用场景主要集中在环境健康与公共安全领域。通过整合地质、土壤、水文及人口统计等多源数据,该数据集为研究人员提供了精准预测家庭氡气浓度的能力。特别是在氡气高暴露风险的宾夕法尼亚州和犹他州,研究人员能够利用该数据集识别高风险区域,从而为公共卫生干预提供科学依据。数据集的高空间分辨率(如ZCTA和亚公里尺度)使其成为研究氡气暴露与肺癌关联的重要工具。
衍生相关工作
该数据集已衍生出多项经典研究,包括作者团队基于其开发的全美氡气暴露风险重分类框架。其他研究利用其多源数据整合方法,拓展至地下水污染或空气质量建模领域。例如,部分学者将类似的空间插值技术应用于PM2.5暴露研究,而地质变量处理流程也被借鉴至矿产勘探的数据标准化工作中。数据集采用的H3地理网格系统更成为后续环境健康研究的通用空间分析基准。
数据集最近研究
最新研究方向
氡暴露数据集(Radon Exposure Dataset)作为环境健康领域的重要资源,近期研究聚焦于高精度地理空间建模与跨学科风险预测。通过整合美国宾夕法尼亚州和犹他州的地质构造、土壤地球化学、水文特征及人口普查数据,该数据集实现了邮政编码区域(ZCTA)和亚公里级尺度的氡浓度预测。当前前沿探索主要围绕三个维度:一是利用H3地理空间索引系统融合多源异构数据,突破传统行政边界的分析限制;二是开发机器学习模型量化建筑年代、供暖类型等社会人口因素与地质参数的交互效应,揭示高风险群体的空间分布规律;三是构建可扩展的全国性评估框架,为《美国公共卫生服务部氡健康咨询》提出的肺癌预防战略提供数据支撑。相关研究正推动环境流行病学与空间统计学的交叉创新,其方法论对重金属污染、地下水安全等公共卫生议题具有范式迁移意义。
相关研究论文
  • 1
    Radon Exposure Dataset橡树岭国家实验室, 乔治亚理工学院 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作