five

DIOR

收藏
arXiv2023-09-22 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2309.12429v1
下载链接
链接失效反馈
官方服务:
资源简介:
DIOR数据集由纽约州立大学布法罗分校计算机科学与工程系创建,专注于室内外远距离3D/2D骨骼步态收集。该数据集包含14个主题和164.9万RGB帧,其中3D/2D骨骼步态标签包括20万帧来自远距离摄像机。DIOR利用先进的3D计算机视觉技术,在室内环境中实现像素级精度,并在室外远距离环境中采用低成本的混合3D计算机视觉和学习管道,仅使用4个低成本RGB摄像机即可实现精确的骨骼标注。此数据集旨在解决远距离步态识别问题,适用于活动识别、身份识别等领域,特别是在需要从屋顶摄像头、无人机摄像头等远距离识别个人的场景中具有重要应用价值。

The DIOR dataset was created by the Department of Computer Science and Engineering, University at Buffalo, The State University of New York. It focuses on collecting 3D/2D skeletal gait data over long distances in both indoor and outdoor environments. This dataset comprises 14 subjects and 1.649 million RGB frames, among which 200,000 frames with 3D/2D skeletal gait labels are captured by long-distance cameras. DIOR leverages advanced 3D computer vision technologies to achieve pixel-level accuracy in indoor environments, while adopting a low-cost hybrid 3D computer vision and learning pipeline for outdoor long-distance scenarios, enabling precise skeletal annotation with only four low-cost RGB cameras. This dataset aims to solve the problem of long-distance gait recognition and is applicable to fields such as activity recognition and identity recognition, with particularly important application value in scenarios requiring individual identification from long-distance cameras like roof-mounted cameras and drone cameras.
提供机构:
纽约州立大学布法罗分校计算机科学与工程系
创建时间:
2023-09-22
搜集汇总
数据集介绍
main_image_url
构建方式
在光学遥感图像目标检测领域,现有数据集普遍存在规模有限、类别单一、图像多样性不足等缺陷,制约了深度学习方法的进一步发展。DIOR数据集的构建旨在填补这一空白,其构建过程首先通过系统调研现有数据集和学术文献,精心筛选出20类常见且具有应用价值的地理空间目标类别,涵盖从飞机、船舶到交通基础设施等多种对象。随后,研究团队从Google Earth等平台采集了23463幅尺寸为800×800像素的遥感图像,这些图像覆盖全球超过80个国家和地区,并在不同成像条件、天气、季节和图像质量下获取,以确保数据的广泛代表性。所有目标实例均采用开源工具LabelMe进行人工标注,共标注192472个实例,每个实例以水平边界框形式标识,标注过程兼顾了目标尺寸的广泛变化和类内类间的多样性,为后续研究提供了高质量的基准数据。
使用方法
DIOR数据集为光学遥感图像目标检测研究提供了标准化的评估框架。数据集已公开可用,研究者可访问指定网站获取数据。在使用前,建议将数据集按标准划分:11725幅图像作为训练验证集,剩余11738幅图像作为测试集,其中训练验证集可进一步细分为训练集和验证集,以确保模型训练与评估的可靠性。数据集中每幅图像均附带标注文件,标注格式为水平边界框,包含目标类别和位置信息,可直接用于主流深度学习框架(如PyTorch、TensorFlow)的模型训练。评估时,通常采用平均精度(AP)和均值平均精度(mAP)作为性能指标,其中检测结果与真实标注的重叠度(IoU)阈值设为50%。研究者可利用该数据集训练和比较各类目标检测算法,如Faster R-CNN、YOLO、RetinaNet等,并通过基准测试了解当前技术水平,为算法改进提供方向。
背景与挑战
背景概述
遥感技术的迅猛发展显著提升了地球表面各类地物表征的影像数量与质量,这自然催生了通过卫星或航空影像自动分析与理解实现智能地球观测的迫切需求。在此背景下,由郑州测绘学院、西北工业大学自动化学院及慕尼黑工业大学等机构的研究人员于2018年联合创建的DIOR数据集应运而生,旨在为光学遥感影像中的目标检测任务提供一个大规模、公开可用的基准。该数据集包含23463幅影像和192472个实例,覆盖20个常见地物类别,其核心研究问题在于解决现有遥感目标检测数据集规模有限、类别稀少、影像多样性与变化不足等缺陷,从而推动深度学习方法的深入探索与验证,对遥感影像解译、智能监测、城市规划等应用领域产生了深远影响。
当前挑战
DIOR数据集致力于应对光学遥感影像中目标检测的核心挑战,包括遥感影像与自然场景影像间的显著差异,如目标通常呈现屋顶视角、存在复杂背景干扰、目标尺度变化剧烈以及旋转多样性等,这些因素使得直接迁移自然影像上的深度学习检测方法效果受限。在数据集构建过程中,研究人员面临多重挑战:需精心筛选具有高实用价值且涵盖城乡多样性的20个目标类别;需处理影像在不同成像条件、天气、季节和质量下的巨大变化,确保数据集的丰富性与代表性;同时,标注工作需应对目标实例尺寸的广泛差异以及类间相似性与类内多样性的平衡,例如桥梁与立交桥、大坝等细粒度类别的区分,这些挑战共同塑造了数据集的复杂性与前沿性。
常用场景
经典使用场景
在遥感图像分析领域,DIOR数据集作为大规模、多类别的光学遥感图像目标检测基准,其经典使用场景主要体现在为深度学习模型提供训练与验证平台。该数据集涵盖20类地理空间对象,如图像中的飞机、船舶、桥梁等,通过其丰富的图像多样性——包括不同天气、季节和成像条件——支持研究者开发鲁棒性强的目标检测算法。在经典应用中,DIOR常被用于评估区域提议网络(如Faster R-CNN)和回归式检测器(如YOLO)在复杂遥感背景下的性能,推动模型在旋转不变性、尺度变化和类间相似性等挑战上的突破。
解决学术问题
DIOR数据集有效解决了遥感图像目标检测中多个关键学术问题。针对现有数据集规模小、类别有限和图像变异不足的局限,DIOR通过提供23463张图像和192472个实例,显著缓解了深度学习模型因数据匮乏导致的过拟合和泛化能力弱的问题。其大范围的物体尺寸变异和高类间相似性,促使研究聚焦于多尺度检测和细粒度分类,推动了旋转不变卷积网络(如RICNN)和特征金字塔网络(FPN)等方法的创新。此外,数据集的公开性促进了学术社区的基准比较,加速了遥感领域从传统方法向数据驱动范式的转型。
实际应用
DIOR数据集在实际应用中支撑了多个地理信息系统和智能监测场景。在城市化进程中,该数据集可用于自动检测基础设施如机场、港口和高速公路服务区,辅助城市规划与交通管理。在环境监测方面,其对风力发电机、水坝等对象的识别能力,有助于可再生能源设施的布局评估和生态影响分析。此外,在国防与安全领域,DIOR支持船舶、车辆等移动目标的实时检测,提升边境监控和海事管理的自动化水平。这些应用不仅提高了遥感图像解译的效率,还为精准农业、灾害响应等提供了可靠的数据基础。
数据集最近研究
最新研究方向
在光学遥感图像领域,DIOR数据集作为大规模、高多样性的基准,正推动着目标检测技术的前沿探索。当前研究聚焦于克服遥感图像中目标旋转、尺度变化及背景复杂等固有挑战,通过引入旋转不变性卷积神经网络(RICNN)、旋转不敏感区域提议网络(RICAOD)以及旋转不变与Fisher判别式CNN(RIFD-CNN)等创新架构,显著提升了多类地理空间目标的检测精度。同时,特征金字塔网络(FPN)与路径聚合网络(PANet)的集成应用,有效增强了模型对多尺度目标的适应能力。回归式检测方法如YOLOv3和CornerNet亦展现出在实时检测与角点定位方面的潜力,而SNIP与SNIPER等高效多尺度训练策略的引入,进一步优化了检测效率与泛化性能。这些进展不仅深化了对遥感图像语义理解,也为智慧城市监测、精准农业等实际应用提供了坚实的技术支撑。
相关研究论文
  • 1
    Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark · 2019年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作