RSUD20K

Name: RSUD20K
Creator: 协和大学蒙特利尔分校
Published: 2024-02-10 07:06:03
License: 暂无描述

arXiv2024-02-10 更新2024-06-21 收录

下载链接：

https://github.com/hasibzunair/RSUD20K

下载链接

链接失效反馈

官方服务：

资源简介：

RSUD20K是由协和大学蒙特利尔分校创建的路面场景理解数据集，包含20334张高分辨率图像，涵盖孟加拉国道路上的驾驶视角。数据集包含130K边界框标注，涉及13种不同对象，适用于自动驾驶技术。该数据集通过收集多样化的道路场景视频序列，并手动标注对象，确保数据质量和多样性。RSUD20K特别适用于解决自动驾驶中的路面场景理解问题，尤其是在处理密集和遮挡对象以及不同天气条件下的场景。

RSUD20K is a road scene understanding dataset developed by Concordia University Montreal. It contains 20,334 high-resolution images captured from the driver's perspective on roads across Bangladesh. The dataset provides 130K bounding box annotations covering 13 distinct object categories, and is designed for autonomous driving applications. It is constructed by collecting diverse road scene video sequences and manually annotating target objects, which ensures high data quality and diversity. RSUD20K is particularly suitable for addressing road scene understanding tasks in autonomous driving, especially for handling scenarios with dense and occluded objects as well as varying weather conditions.

提供机构：

协和大学蒙特利尔分校

创建时间：

2024-01-15

搜集汇总

数据集介绍

构建方式

在自动驾驶领域，数据集的构建需兼顾真实性与多样性，以应对复杂道路场景的挑战。RSUD20K数据集的构建采用了一种创新的三阶段数据引擎方法。首先，通过车载摄像头在孟加拉国道路采集超过80段高分辨率视频序列，涵盖城市、郊区及多种天气条件，确保场景的广泛代表性。随后，专业标注团队对4000张随机采样图像进行手动标注，精确勾勒13类目标对象的边界框，并剔除遮挡率超过50%的实例。在此基础上，利用已标注数据训练YOLOv6-M6模型，对验证集和测试集进行半自动标注，通过人工修正伪标签以提升标注效率与准确性。最终，采用全自动标注策略，将模型扩展至剩余未标注图像，生成伪标签并整合，形成包含20334张图像和13万标注框的完整数据集。

特点

RSUD20K数据集在道路场景理解领域展现出鲜明的独特性。其图像均以1920×1080高分辨率采集自驾驶视角，囊括了孟加拉国地区狭窄街道、无标线道路及拥挤环境等多样化场景，并覆盖昼夜与雨天等复杂光照条件。数据集中包含13类目标对象，如人力车、三轮车等地域特色交通工具，同时呈现显著的类别不平衡，例如“行人”实例超过3万，而“人力搬运车”仅455例。此外，图像中目标密集度高，平均每图包含4至9个边界框，部分场景甚至达到23个，且存在大量遮挡与多视角对象，这些特征共同构成了对现有目标检测模型的严峻挑战。

使用方法

RSUD20K数据集为自动驾驶视觉研究提供了重要的基准平台。研究者可将其划分为训练集、验证集和测试集，用于训练和评估各类目标检测模型，如YOLO系列、DETR等，并通过平均精度均值（mAP）等指标量化性能。该数据集尤其适用于探究模型在跨地理区域场景下的泛化能力，以及应对遮挡、小目标和光照变化的鲁棒性。此外，数据集支持以数据为中心的研究范式，例如利用大型视觉模型进行零样本自动标注实验，或用于半监督学习方法的开发。通过公开提供的代码与预训练模型，用户能快速复现基准实验，并在此基础上推动针对复杂道路环境的算法创新。

背景与挑战

背景概述

RSUD20K数据集由研究团队于近年提出，旨在推动自动驾驶系统中道路场景理解算法的跨地域泛化能力。该数据集聚焦于孟加拉国道路环境，收录了超过20,000张高分辨率驾驶视角图像，并提供了130,000个边界框标注，涵盖行人、人力车、卡车等13类关键对象。其核心研究问题在于解决现有基于数据驱动的物体检测模型在特定地理区域（如北美或欧洲）训练后，难以适应南亚等新兴市场复杂道路场景的局限性。通过呈现狭窄街道、无车道标线、密集遮挡及多样天气条件等真实驾驶情境，RSUD20K为自动驾驶感知系统的鲁棒性评估提供了重要基准，弥补了地理多样性在现有数据集中的不足。

当前挑战

RSUD20K数据集所应对的领域挑战集中于复杂道路场景下的物体检测任务。具体包括：在无典型车道标线的狭窄街道中准确识别多视角对象；处理高度拥挤环境下密集遮挡的小尺度物体；以及适应昼夜交替、雨天等多变光照条件带来的识别困难。构建过程中的挑战则体现于数据标注的复杂度：需在保持标注质量的前提下，高效处理大量图像，为此团队采用了从人工标注到半自动、全自动标注的三阶段流程，以平衡标注成本与数据规模。此外，数据集中存在的类别不平衡现象，如人力车等本地化交通工具与通用车辆类别的样本量差异，也为模型训练带来了额外挑战。

常用场景

经典使用场景

在自动驾驶系统的感知模块开发中，RSUD20K数据集常被用于训练和评估目标检测模型在复杂城市道路场景下的泛化能力。该数据集聚焦于孟加拉国特有的交通环境，包含大量狭窄街道、无明确车道标识的道路以及人力车辆等独特元素，为研究模型在非结构化道路和多样化交通工具识别中的表现提供了标准测试平台。其高分辨率图像和精细的边界框标注，使得研究者能够系统分析模型在遮挡、密集物体和多种天气条件下的鲁棒性。

衍生相关工作

围绕RSUD20K数据集，已衍生出多项聚焦数据高效利用与模型泛化的研究。例如，基于其半自动标注框架，研究者探索了YOLOv6等模型在伪标签生成中的有效性；同时，工作系统评估了Grounding DINO、DETIC等大规模视觉模型在零样本标注该数据集时的性能局限，揭示了基础模型在特定地理区域对象识别上的不足。这些研究推动了面向数据稀缺场景的自动化标注方法，以及针对地域特有对象的检测器适应性改进。

数据集最近研究