Exposure Assessment Benchmark Dataset
收藏arXiv2023-05-04 更新2024-06-21 收录
下载链接:
https://github.com/akapet00/thermal-dosimetry-surrogate.git
下载链接
链接失效反馈官方服务:
资源简介:
Exposure Assessment Benchmark Dataset是由克罗地亚斯普利特大学的研究团队创建的一个综合性的开放源数据集,专注于10-90 GHz频段的电磁场暴露评估。该数据集包含10,000条通过统计模型从现有数据中生成的合成数据,涵盖了不同频率和距离下的功率密度及皮肤表面最大温度升高的数据。数据集的创建过程涉及使用高斯copula模型来捕捉数据的分布和依赖关系,并应用了剂量学约束以确保数据的物理合理性。该数据集主要用于支持计算剂量学研究,帮助研究人员在不进行资源密集型模拟的情况下开发和测试新的计算方法,从而有效解决电磁场暴露评估中的问题。
Exposure Assessment Benchmark Dataset is a comprehensive open-source dataset developed by a research team from the University of Split, Croatia, focusing on electromagnetic field exposure assessment within the 10–90 GHz frequency band. It contains 10,000 synthetic data samples generated from existing datasets via statistical models, covering power density and maximum skin surface temperature elevation data across different frequencies and distances. The dataset creation process utilizes a Gaussian copula model to capture the data distribution and dependencies, and applies dosimetric constraints to ensure the physical plausibility of all generated data. This dataset is primarily designed to support computational dosimetry research, allowing researchers to develop and test novel computational methods without resorting to resource-intensive simulations, thus effectively addressing core challenges in electromagnetic field exposure assessment.
提供机构:
克罗地亚斯普利特大学
创建时间:
2023-05-04
搜集汇总
数据集介绍

构建方式
在电磁暴露评估领域,标准化数据集的匮乏长期制约着新型计算方法的开发与验证。为应对这一挑战,本研究基于10-90 GHz频段内多种稳态暴露场景下的现有数据,采用统计建模方法构建了合成数据集。具体而言,研究团队首先收集了115组原始数据,涵盖天线与组织间距、频率及四种空间平均入射功率密度等特征。随后,通过拟合高斯Copula模型捕获各特征的边缘概率分布及其依赖结构,并施加剂量学约束以确保采样值的物理合理性。最终,从该模型中抽取了10000组多元样本,生成了覆盖10-90 GHz全频段及2-150 mm间距范围的合成数据,从而形成了一套全面且开源的高保真数值数据集。
使用方法
该数据集主要服务于计算剂量学领域的研究人员,用于开发和测试暴露评估中的代理模型。使用者可直接从GitHub公开仓库获取数据集,其表格化结构便于直接导入各类机器学习框架。数据集已按80-20比例预设了训练与测试分割,支持监督学习模型的快速构建。研究实践中,可基于该数据集训练如XGBoost、多层感知机、TabNet及混合专家模型等多种代理模型,以预测特定暴露场景下的皮肤表面最大温升。通过对比模型在原始数据上的平均绝对误差,可有效验证合成数据的实用性与模型的预测性能,从而加速新型计算方法的原型开发与验证流程。
背景与挑战
背景概述
随着第五代无线通信技术的广泛应用,电磁场暴露评估与剂量学研究领域对高精度数值数据的需求日益迫切。由斯普利特大学、电气通信大学等机构的研究人员于2023年联合创建的Exposure Assessment Benchmark Dataset,旨在填补该领域标准化数据集的空白。该数据集聚焦于10至90 GHz频段内局部稳态暴露场景下的入射功率密度与皮肤表面最大温升关系,其核心研究问题在于为计算剂量学方法提供可靠基准,以支持电磁场生物安全标准的修订与验证。通过合成数据生成与统计建模,该数据集不仅推动了暴露评估技术的创新,还为相关国际标准如IEEE 2889-2021的制定提供了实证基础,显著提升了该领域研究的可重复性与效率。
当前挑战
在电磁场暴露评估领域,准确量化高频电磁辐射对生物组织的影响面临多重挑战。一方面,入射功率密度与温升之间的复杂非线性关系难以通过传统模型精确刻画,尤其是在近场区域中电磁场分布的异质性加剧了预测误差。另一方面,数据构建过程中,原始数值数据的稀缺性与异构性构成了主要障碍;不同机构采用的计算模型与仿真软件存在差异,导致数据一致性不足,且高保真数值模拟的计算成本极高,易引入配置错误。此外,合成数据生成需严格遵循剂量学约束,以确保物理合理性,这对统计建模方法的稳健性提出了更高要求。
常用场景
经典使用场景
在电磁场暴露评估与剂量学研究领域,Exposure Assessment Benchmark Dataset 为开发新型计算技术提供了标准化的基准测试平台。该数据集通过统计建模生成了10-90 GHz频段内局部稳态暴露下的入射功率密度与皮肤表面最大温升数据,涵盖了多种真实暴露场景。研究人员可利用这一高质量合成数据集,快速验证算法性能,避免重复进行耗时的电磁仿真计算,从而加速暴露评估模型的迭代与优化进程。
解决学术问题
该数据集有效解决了电磁生物效应研究中缺乏公开标准化数据的瓶颈问题。通过提供涵盖不同频率、天线-组织间距及功率密度组合的合成数据,它支持了暴露剂量与温升关联性的量化分析,为建立可靠的代理模型奠定了数据基础。其意义在于促进了计算剂量学方法的可比性与可重复性,推动了国际暴露限值指南(如ICNIRP与IEEE标准)的科学修订,并为毫米波频段生物安全评估提供了关键数据支撑。
实际应用
在实际应用中,该数据集被广泛用于无线通信设备的安全性设计与合规性测试。工程师可基于数据集训练的代理模型,快速预测新型天线在近场暴露下的局部温升,优化设备布局以符合电磁暴露限值要求。此外,监管机构与标准制定组织可借助该数据集验证仿真工具的准确性,确保5G及未来高频通信技术的部署符合人体健康防护规范,从而在技术创新与公共安全之间实现平衡。
数据集最近研究
最新研究方向
随着5G及毫米波通信技术的快速发展,电磁场暴露评估领域对高精度、标准化数据集的需求日益迫切。该数据集聚焦于10-90 GHz频段的局部稳态暴露场景,通过统计建模生成合成数据,以弥补传统仿真方法在计算成本与误差控制方面的不足。前沿研究主要围绕基于该数据集的代理模型构建展开,例如混合专家模型结合多项式与张量积样条方法,实现了对皮肤表面最大温升的高效预测,平均绝对误差低至0.058°C。这一进展不仅为电磁安全标准的验证提供了可靠工具,也推动了计算剂量学在新型无线设备生物效应评估中的应用,相关成果已融入IEEE 2889-2021等国际标准制定,对保障公众健康与通信技术协调发展具有深远意义。
相关研究论文
- 1Standardized Benchmark Dataset for Localized Exposure to a Realistic Source at 10$-$90 GHz克罗地亚斯普利特大学 · 2023年
以上内容由遇见数据集搜集并总结生成



