five

rtm_emulation

收藏
Hugging Face2025-04-17 更新2025-04-18 收录
下载链接:
https://huggingface.co/datasets/JulioContrerasH/rtm_emulation
下载链接
链接失效反馈
官方服务:
资源简介:
大气辐射传输模拟仿真数据集,用于训练机器学习模型预测大气传输函数。数据集包括两种应用场景:大气校正和二氧化碳柱状检索。每个场景都有两个测试数据集,用于评估模型在插值和 extrapolation任务中的性能。数据以HDF5格式存储,包括输入参数和对应的传输函数输出。参赛者需要基于提供的训练数据集开发模型,并在测试数据集上进行预测,以评估模型的准确性和计算效率。
创建时间:
2025-04-17
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过拉丁超立方采样方法构建,确保输入空间全面覆盖并减少病态问题。训练数据以HDF5格式存储,包含大气传输函数、输入变量矩阵及波长值三个核心组件,测试数据则采用CSV格式。数据集针对大气校正和CO2柱浓度反演两大应用场景,分别提供不同光谱范围和分辨率的模拟数据,并通过插值与外推两种测试轨迹评估模型性能。
特点
数据集聚焦高光谱大气辐射传输模拟领域,具有输入维度高(约10维)、输出维度大(数千通道)的典型特征。其独特价值在于同时包含400-2500nm宽光谱范围(5cm-1分辨率)和2000-2100nm精细光谱(0.1cm-1分辨率)两类数据,支持跨场景的迁移学习研究。数据采用分层存储结构,允许用户根据计算资源灵活选择不同规模的训练子集(如train2000.h5)。
使用方法
使用该数据集需通过HDF5接口读取训练数据,其中LUTdata为输出变量矩阵,LUTHeader存储输入参数,wvl记录波长序列。测试数据通过CSV文件加载输入参数后,需按指定格式输出预测结果。提交评估时要求包含HDF5格式的预测文件及模型元数据,预测文件需注明场景标识和计算耗时。官方提供Python、Matlab和R三种语言的示例代码,支持跨平台研究复现。
背景与挑战
背景概述
大气辐射传输模型(RTM)在地球与气候科学中扮演着核心角色,广泛应用于合成场景生成、卫星数据处理及数值天气预报等领域。随着模型复杂度的提升,其计算负担成为制约实际应用的瓶颈。传统基于查找表(LUT)的插值方法虽能缓解计算压力,但面临内存占用高、生成周期长且泛化性不足等问题,尤其在高光谱卫星任务中,数据量激增使得问题更为突出。在此背景下,由欧盟资助的ELIAS项目于2023年启动,旨在通过统计回归算法构建RTM的替代模型(emulator),实现实时卫星数据处理与高精度气候模拟。该数据集发布于2025年,聚焦大气校正与CO2柱浓度反演两大场景,为物理驱动的人工智能系统开发提供了标准化测试平台。
当前挑战
该数据集面临三重核心挑战:其一,输入输出空间的高维特性(输入约10维,输出数千维)与电磁辐射-大气相互作用的非线性关系,要求模型具备极强的特征提取能力;其二,构建过程中需平衡拉丁超立方采样的覆盖度与计算可行性,避免因参数组合爆炸导致数据稀疏;其三,跨场景评估要求模型同时满足插值稳定性(如大气校正场景的400-2500nm全波段预测)与外推鲁棒性(如CO2敏感波段2000-2100nm的高分辨率建模)。此外,计算效率与预测精度的权衡、不同硬件环境下的性能可比性,均为该领域亟待突破的关键问题。
常用场景
经典使用场景
在大气辐射传输模型(RTM)研究中,rtm_emulation数据集被广泛用于开发和测试机器学习模型,以模拟复杂的大气辐射传输过程。该数据集特别适用于高光谱卫星数据的处理,通过提供预计算的辐射传输函数,帮助研究者训练高效的仿真模型,从而替代传统耗时的数值模拟方法。经典使用场景包括大气校正和二氧化碳柱浓度反演,这些场景要求模型能够精确预测不同大气条件下的光谱响应。
解决学术问题
rtm_emulation数据集解决了大气辐射传输模型计算复杂度高、耗时长的学术难题。通过提供标准化的训练和测试数据,研究者能够开发高效的统计回归算法,替代传统的查找表插值方法。这不仅显著降低了计算成本,还提升了模型在大气校正和气体反演任务中的精度和泛化能力,为气候科学和地球观测领域提供了重要的技术支撑。
衍生相关工作
rtm_emulation数据集催生了一系列相关研究,包括基于深度学习的辐射传输仿真模型、不确定性量化方法以及物理信息融合的AI系统。这些工作进一步推动了气候建模和遥感数据处理领域的发展,例如在ECML-PKDD等国际会议上发表的论文,以及针对高光谱数据优化的新型算法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作