five

OpenEarthSensing|遥感数据集|图像识别数据集

收藏
arXiv2025-02-28 更新2025-03-04 收录
遥感
图像识别
下载链接:
http://arxiv.org/abs/2502.20668v1
下载链接
链接失效反馈
资源简介:
OpenEarthSensing是一个面向开放世界遥感任务的大规模细粒度基准数据集,由华中科技大学、深圳市鹏城实验室和中国科学院共同创建。该数据集包含189个场景和对象类别,跨越5个不同的领域和3种模态,共157,674张图像。数据集覆盖了现实世界中可能发生的绝大多数语义偏移场景。此外,它还包含五个具有显著协变量偏移的数据领域,为评估开放世界模型的泛化性能提供了一个更全面的测试平台。
提供机构:
华中科技大学, 深圳市鹏城实验室, 中国科学院
创建时间:
2025-02-28
AI搜集汇总
数据集介绍
main_image_url
构建方式
OpenEarthSensing 数据集的构建旨在模拟开放世界遥感中的语义变化和协变量变化。该数据集由五个子数据集组成,涵盖了五个不同的领域和三种模态,包括两个 RGB 卫星图像数据集、一个 RGB 无人机航拍图像数据集、一个 MSRGB 数据集和一个红外数据集。这些子数据集具有相同的语义类别,但包含不同的协变量变化条件,为评估开放世界模型的泛化能力提供了更全面的测试平台。OpenEarthSensing 包含 189 个场景和对象类别,涵盖了现实世界中可能发生的绝大多数语义变化场景。
特点
OpenEarthSensing 数据集的特点包括多个和多样化的领域、广泛的规模范围和多个粗略类别。它包含五个不同的数据领域,使其能够作为各种泛化任务的测试平台。此外,OpenEarthSensing 包含 152 个场景和 37 个对象类别,涵盖了不同规模的分类数据。它还包含 10 个全面的粗略类别,每个粗略类别进一步细分为 5 到 27 个细粒度子类别,总共 189 个不同的分类。这使得 OpenEarthSensing 成为评估开放世界遥感模型性能的重要基准。
使用方法
使用 OpenEarthSensing 数据集时,可以根据任务需求选择相应的子数据集。例如,对于开放集识别和语义变化 OOD 检测任务,可以使用 ID-94 子数据集作为训练数据,Easy-OOD 和 Hard-OOD 子数据集作为近 OOD 数据,以及 SUN 子数据集作为远 OOD 数据。对于协变量变化泛化和 OOD 检测任务,可以使用 ID-94 子数据集作为训练数据,其他四个子数据集作为测试数据。对于增量学习任务,可以使用 Dall R1 子数据集作为训练数据,并设置不同的场景,例如随机、粗略和规模,以模拟真实世界中的连续学习过程。此外,还可以使用不同的模型和算法进行评估和比较,以找出最佳的性能。
背景与挑战
背景概述
OpenEarthSensing数据集是在遥感领域的一个大型细粒度基准数据集,旨在为开放世界遥感任务提供评估平台。该数据集由华中科技大学、鹏城实验室和中国科学院的研究人员于2025年创建。OpenEarthSensing数据集包含了189个场景和物体类别,涵盖了现实世界中可能出现的绝大多数语义变化。此外,它还涵盖了五个具有显著协变量变化的数据域,包括两个RGB卫星域、一个RGB航空域、一个MSRGB域和一个红外域,为评估开放世界模型的一般化性能提供了一个更全面的测试平台。OpenEarthSensing的创建填补了开放世界遥感领域大型基准数据集的空白,对推动该领域的研究具有重要意义。
当前挑战
OpenEarthSensing数据集的挑战主要在于解决开放世界遥感任务中的各种问题。具体挑战包括:1) 语义变化检测,模型需要能够有效识别未知类别;2) 协变量变化适应,模型需要能够适应测试时遇到的各种变化;3) 持续更新,模型需要能够根据新样本不断更新自身。此外,构建过程中也遇到了一些挑战,例如:1) 数据集规模和多样性不足,无法反映现实世界的复杂性;2) 数据集缺乏对特定任务的针对性,无法满足开放世界的需求。OpenEarthSensing数据集的创建为解决这些挑战提供了一个重要的工具。
常用场景
经典使用场景
OpenEarthSensing数据集作为开放世界遥感领域的大型细粒度基准数据集,其经典使用场景包括语义偏移检测、协变量偏移适应、开放集识别、增量学习和域增量学习等。该数据集包含来自五个不同领域和三种模态的189个场景和对象类别,为评估开放世界模型的泛化性能提供了全面的测试平台。
解决学术问题
OpenEarthSensing数据集解决了开放世界遥感领域中模型适应新数据分布的挑战,特别是语义偏移和协变量偏移。该数据集涵盖了现实世界中可能出现的绝大多数语义偏移场景,并通过五个具有显著协变量偏移的数据领域,为评估模型在不同环境下的泛化能力提供了基准。此外,OpenEarthSensing数据集还为开放世界任务提供了更具挑战性的基准,促进了该领域的研究和发展。
衍生相关工作
OpenEarthSensing数据集的推出,为开放世界遥感领域的研究提供了新的契机,衍生出了一系列相关的研究工作。例如,基于OpenEarthSensing数据集,研究人员可以探索新的开放世界任务和方法,评估现有模型在开放环境下的性能,并开发新的算法和技术来提升模型的适应性和泛化能力。此外,OpenEarthSensing数据集还可以用于开发新的遥感图像解释方法和技术,为相关领域的应用提供支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

UAVDT

UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。

arXiv 收录