five

Dist_Uncertainty

收藏
Hugging Face2026-02-17 更新2026-02-18 收录
下载链接:
https://huggingface.co/datasets/Avatarr05/Dist_Uncertainty
下载链接
链接失效反馈
官方服务:
资源简介:
Dist_Uncertainty 数据集包含高光谱遥感影像和相关的土地覆盖标签,用于评估基于深度学习的植物性状反演中的不确定性估计方法。数据集支持对基于距离的不确定性方法(Dis_UN)与传统方法(深度集成和蒙特卡洛 dropout)的比较评估。数据集包括来自不同传感器和地理位置的两种真实世界高光谱场景:德国南莱比锡的 EnMAP 场景和美国威斯康星州 Liro 站点的 NEON AOP 场景。每个场景都包含光谱波段元数据和像素级土地覆盖标签,用于识别训练数据中未表示的域外(OOD)成分,如城市表面、裸地、水体和云。数据集还包括一个包含 1522 个标记训练光谱的参考分布文件(TrainingSpectra_1522.csv),用于计算新数据与训练分布的距离以量化不确定性。
创建时间:
2026-02-15
搜集汇总
数据集介绍
构建方式
在遥感科学领域,高光谱数据为植被性状反演提供了丰富的光谱信息。Dist_Uncertainty数据集的构建旨在支持深度学习模型不确定性评估的研究。该数据集整合了来自EnMAP和NEON两种传感器的真实高光谱场景,分别覆盖德国南莱比锡和美国威斯康星州Liro站点。核心训练集包含1522条标注光谱,作为监督学习的参考分布;同时,每个案例研究场景均配有光谱波段元数据及像素级土地覆盖标签,专门用于标识训练数据中未出现的异域成分,如城市表面、裸地、水体和云层。
特点
该数据集的特点体现在其专为不确定性量化而设计的结构上。它不仅提供了多源高光谱影像与对应标签,更通过明确的异域测试案例,支持对距离不确定性方法与传统方法的对比评估。训练光谱池作为基准分布,使得在推理阶段能够计算新光谱与已知分布之间的差异,从而量化其不确定性。数据集的二元地理来源与传感器差异,增强了其在评估模型泛化能力与鲁棒性方面的科学价值。
使用方法
在植被遥感与深度学习交叉研究中,该数据集主要用于评估植物性状反演中的不确定性估计方法。使用者可加载训练光谱作为参考分布,并利用两个案例研究的高光谱影像及土地覆盖掩膜进行测试。通过计算新观测光谱与训练集在预测器或嵌入空间中的距离,能够实施距离不确定性方法,并与集成学习或蒙特卡洛丢弃等传统方法进行性能比较。数据以CSV和GeoTIFF格式提供,需结合相应遥感处理工具进行光谱分析与模型验证。
背景与挑战
背景概述
高光谱遥感技术在植被性状反演领域展现出巨大潜力,然而深度学习模型在应对分布外数据时的不确定性量化问题,始终是制约其可靠应用的关键瓶颈。Dist_Uncertainty数据集由Cherif等人于2025年构建,并随同其发表于《Biogeosciences》的论文一同发布,核心研究聚焦于评估基于距离的不确定性方法在植物性状反演中的效能。该数据集整合了来自德国环境制图与分析计划(EnMAP)和美国国家生态观测网络(NEON)的两套真实高光谱场景,旨在为不确定性估计方法提供标准化的测试基准,推动遥感与生态学交叉领域向更可信、可解释的人工智能方向发展。
当前挑战
该数据集致力于解决高光谱植被性状反演中模型不确定性量化的核心挑战,特别是在面对城市地表、裸土、水体及云层等训练数据未涵盖的分布外场景时,传统深度学习方法往往产生过度自信的预测,导致决策风险。在构建过程中,研究团队需克服多源异构数据融合的困难,包括协调不同传感器(EnMAP与NEON)的波段元数据与空间分辨率差异,并确保土地覆盖标签在不同地理区域间具有一致且可靠的语义标注,从而为不确定性评估提供坚实的数据基础。
常用场景
经典使用场景
在遥感与生态学交叉领域,Dist_Uncertainty数据集为深度学习模型在植物性状反演中的不确定性评估提供了标准化的测试基准。其核心应用场景在于,利用来自EnMAP和NEON传感器的两幅真实高光谱遥感影像,结合像素级土地覆盖标签,系统性地模拟出域外(OOD)测试条件。研究者通过计算新观测光谱与数据集中1522条标记训练光谱在预测空间和嵌入空间的距离,量化模型面对未知地物(如城市表面、裸地、水体)时的预测不确定性,从而严谨评估如Dis_UN等距离不确定性方法相对于传统深度集成或蒙特卡洛丢弃法的性能优劣。
衍生相关工作
围绕Dist_Uncertainty数据集,已衍生出一系列专注于高光谱遥感不确定性量化的经典研究工作。其伴生论文(Cherif et al., 2025)提出的距离不确定性方法(Dis_UN)构成了核心参照。后续研究可在此基础上,探索将这种框架与更先进的域适应、自监督学习或贝叶斯深度学习模型相结合,以进一步提升OOD检测的灵敏度。同时,该数据集也为评估不确定性估计在多传感器数据融合、时序变化检测以及生态系统模型同化等复杂场景中的泛化能力提供了宝贵的实验平台,催生了跨遥感、机器学习和生态学的方法论创新。
数据集最近研究
最新研究方向
在植被遥感领域,高光谱数据为植物性状反演提供了丰富的光谱信息,而深度学习模型的应用则带来了对预测结果不确定性量化的迫切需求。Dist_Uncertainty数据集作为专门用于评估不确定性估计方法的基准,其最新研究聚焦于距离不确定性方法(Dis_UN)与传统深度集成、蒙特卡洛丢弃等技术的对比验证。前沿探索集中在利用训练光谱参考分布,通过计算新观测光谱在预测空间与嵌入空间中的差异,以识别超出训练分布的域外成分,如城市地表、裸土和水体。这一方向紧密关联于提升遥感产品在生态监测、农业管理中的可靠性,尤其在应对传感器差异与地理异质性带来的挑战时,为模型的可解释性与决策安全性提供了关键支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作