five

ISSSD-2024

收藏
github2024-08-30 更新2024-09-01 收录
下载链接:
https://github.com/SergioSarmientoRosales/ISSSD-2024
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自四个不同城市的数据,其中Clean数据集指的是经过质量检查的圣安东尼奥数据集,去除了缺失数据并删除了前两列(日期)。

This dataset comprises data from four distinct cities. The Clean dataset specifically refers to the quality-checked San Antonio dataset, from which missing data has been removed and the first two columns (dates) have been deleted.
创建时间:
2024-08-30
原始信息汇总

ISSSD-2024 数据集概述

数据集描述

该数据集用于复现题为“使用先进机器学习技术和时间序列模型预测剂量当量率的比较研究”的工作。

数据来源

可通过以下链接下载额外数据:https://radnet.epa.gov/radnet-public/query.do。提供的代码适用于单列(清洁数据集)。确保过滤数据集以去除缺失或低质量数据。

数据集内容

  • 城市数据:包含来自四个不同城市的数据。
  • 清洁数据集:特指经过质量检查的圣安东尼奥数据集,去除了缺失数据并删除了前两列(日期)。
  • 散点图:显示了来自五个不同模型的测试数据集的结果。
  • 测量值与预测值比较:包含每个模型的测试数据,其中每个CSV文件的第一列代表测量数据,第二列代表预测数据。

代码脚本

提供了两个脚本:一个适用于Colab,另一个为.py格式。

搜集汇总
数据集介绍
main_image_url
构建方式
ISSSD-2024数据集的构建基于对四个不同城市数据的收集与处理,其中特别关注了San Antonio的数据质量。该数据集通过从RadNet公共查询系统中获取原始数据,并进行严格的筛选和清洗,剔除了缺失或低质量的数据,同时去除了前两列日期信息,以确保数据的纯净性和可用性。
特点
ISSSD-2024数据集的显著特点在于其高质量的数据清洗过程和多城市数据的覆盖。该数据集不仅包含了来自四个不同城市的辐射数据,还通过对比测量数据与预测数据的散点图,展示了五种不同模型在测试数据上的表现,为研究者提供了丰富的分析视角和对比基础。
使用方法
使用ISSSD-2024数据集时,研究者可以通过提供的Colab脚本或Python脚本进行数据处理和模型测试。数据集中的'Clean'数据集特别适用于单列数据的分析,而'Comparison Measured vs Forecasted'文件夹则提供了各模型测试数据的详细对比,便于研究者进行深入的模型性能评估。
背景与挑战
背景概述
ISSSD-2024数据集由一组研究人员创建,旨在支持题为《使用高级机器学习技术和时间序列模型预测剂量当量率比较研究》的研究工作。该数据集的构建时间可追溯至2024年,主要研究人员或机构未明确提及,但其核心研究问题聚焦于通过先进的机器学习方法和时间序列模型来提高剂量当量率的预测精度。这一研究对辐射监测和环境保护领域具有重要意义,因为它有助于提升对辐射水平的实时监控和预测能力,从而为公共健康和安全提供更可靠的保障。
当前挑战
ISSSD-2024数据集在构建过程中面临多项挑战。首先,数据来源于四个不同城市的辐射监测数据,确保这些数据的质量和一致性是一个重要任务。其次,数据集中存在缺失和低质量数据,需要通过精细的数据清洗过程来消除这些影响。此外,该数据集旨在支持多种模型的测试和比较,因此如何确保不同模型在同一数据集上的公平性和可比性也是一个关键挑战。最后,数据集的实际应用中,如何有效地将预测结果与实际测量数据进行对比和验证,以确保模型的准确性和可靠性,是另一个需要克服的难题。
常用场景
经典使用场景
ISSSD-2024数据集在辐射剂量等效率预测领域中具有经典应用。通过整合来自四个不同城市的辐射数据,该数据集为研究人员提供了一个全面且高质量的数据平台,用于比较和验证先进的机器学习技术和时间序列模型在预测辐射剂量等效率方面的性能。具体而言,数据集中的'Clean'数据集,即经过质量检查的圣安东尼奥数据集,被广泛用于模型训练和测试,以确保预测结果的准确性和可靠性。
解决学术问题
ISSSD-2024数据集在解决辐射剂量等效率预测的学术研究问题中发挥了关键作用。通过提供高质量、经过筛选的辐射数据,该数据集帮助研究人员克服了数据缺失和质量低下的常见问题,从而提高了模型的预测精度。此外,数据集的多城市数据来源为跨区域辐射剂量等效率预测模型的泛化能力提供了有力支持,推动了相关领域的研究进展。
衍生相关工作
基于ISSSD-2024数据集,研究人员开展了一系列相关工作,推动了辐射剂量等效率预测领域的发展。例如,有研究通过对比不同机器学习算法和时间序列模型在该数据集上的表现,提出了更优的预测模型架构。此外,数据集的多城市数据特性还激发了跨区域辐射剂量等效率预测模型的研究,为全球辐射监测网络的建设提供了理论和实践基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作