CODA

Name: CODA
Creator: 华为诺亚方舟实验室
Published: 2022-09-17 12:52:35
License: 暂无描述

arXiv2022-09-17 更新2024-06-21 收录

下载链接：

https://coda-dataset.github.io

下载链接

链接失效反馈

官方服务：

资源简介：

CODA数据集是由华为诺亚方舟实验室创建的一个针对自动驾驶领域的真实世界道路角落案例数据集。该数据集精选了1500个真实驾驶场景，每个场景中平均包含四个对象级别的角落案例，覆盖了超过30个对象类别。CODA数据集的构建旨在解决自动驾驶系统在面对不常见对象和极端情况时的检测挑战，通过提供高质量的标注数据，推动自动驾驶技术向更可靠的方向发展。数据集的应用领域主要集中在自动驾驶系统的对象检测性能评估，特别是在处理复杂和不可预见的路况时的能力。

The CODA dataset is a real-world road corner case dataset for the autonomous driving domain, created by Huawei Noah's Ark Lab. It comprises 1500 carefully curated real driving scenarios, with an average of four object-level corner cases per scenario and coverage of over 30 object categories. Developed to address the detection challenges encountered by autonomous driving systems when facing uncommon objects and extreme scenarios, the CODA dataset aims to promote the advancement of more reliable autonomous driving technologies by providing high-quality annotated data. Its primary applications focus on the performance evaluation of object detection for autonomous driving systems, particularly their capability to handle complex and unforeseeable road conditions.

提供机构：

华为诺亚方舟实验室

创建时间：

2022-03-15

搜集汇总

数据集介绍

构建方式

CODA 数据集的构建基于三个主要的自动驾驶目标检测基准数据集——KITTI、nuScenes 和 ONCE。为了筛选出真实的道路场景中的角案例，数据集构建分为两个阶段：首先通过自动化生成角案例提案，然后进行人工检查和修正。其中，自动化提案生成过程使用 COPG 管道，该管道仅需要来自相机和激光雷达传感器的原始传感器数据，无需标注。在第一阶段，COPG 管道从激光雷达点云中识别潜在角案例，并通过语义分割去除背景物体，最后通过物体检测器去除常见类别。在第二阶段，人工对提案进行筛选和标注，最终形成 CODA 数据集。

特点

CODA 数据集的特点在于其真实性和多样性。数据集包含 1500 个精心挑选的真实世界驾驶场景，每个场景平均包含四个对象级别的角案例，涵盖了超过 30 个对象类别。数据集涵盖了多种场景和新型对象，例如动物、交通设施、障碍物等，这些对象在现有的自动驾驶基准数据集中往往被忽略。此外，CODA 数据集还包含了来自三个不同国家的场景，以及不同的天气条件和昼夜时间，从而进一步增加了数据集的多样性。

使用方法

CODA 数据集可用于评估自动驾驶系统中的目标检测方法的鲁棒性和泛化能力。数据集提供了多种评估指标，例如 COCO-style 平均召回率 (AR)、AR50、AR75 等，可以全面评估目标检测方法在不同类别和不同数量目标上的表现。此外，CODA 数据集还可用于评估少样本目标检测 (FSOD) 等适应方法。

背景与挑战

背景概述

自动驾驶技术的发展离不开对周围环境的准确感知，其中物体检测是至关重要的环节。然而，现有的物体检测模型大多针对常见的交通参与者，如行人、汽车等进行训练，对于罕见或异常的物体和场景（例如，一只狗穿过马路）往往无法准确识别，这可能导致严重的安全事故。为了解决这一问题，华为诺亚方舟实验室的研究人员于2022年9月提出了CODA数据集，旨在为自动驾驶中的物体检测提供一个真实世界的场景角案例数据集。CODA数据集包含了1500个精心挑选的真实世界驾驶场景，每个场景平均包含四个物体级别的角案例，涵盖了超过30个物体类别。该数据集的创建旨在推动自动驾驶领域中可靠物体检测技术的发展，并为评估物体检测器在角案例场景下的性能提供了一个基准。

当前挑战

CODA数据集的创建面临着一系列挑战。首先，如何有效地从大规模的自动驾驶数据集中筛选出角案例场景是一个关键问题。其次，如何对角案例进行准确的标注也是一个挑战，因为角案例往往包含罕见或异常的物体，难以用现有的标注工具进行标注。此外，CODA数据集的创建还面临着如何评估物体检测器在角案例场景下的性能的挑战，因为角案例场景与训练数据集之间存在较大的领域差异，现有的评估指标可能无法准确反映物体检测器的性能。

常用场景

经典使用场景

CODA 数据集为自动驾驶领域中的目标检测任务提供了宝贵的训练数据。该数据集包含 1500 个精心挑选的真实驾驶场景，每个场景平均包含四个对象级别的边缘情况，涵盖了超过 30 个对象类别。这些边缘情况通常是指训练过程中未见过或很少见到的对象，例如过马路的狗或路面上的轮胎。CODA 数据集的引入，旨在解决现有目标检测器在面对此类边缘情况时的性能下降问题，推动自动驾驶技术的可靠性和安全性。

实际应用

CODA 数据集在实际应用中具有重要意义。自动驾驶车辆在行驶过程中可能会遇到各种边缘情况，例如路面上的障碍物、失控的车辆或突然出现的行人。如果目标检测器无法准确识别这些边缘情况，可能会导致严重的交通事故。CODA 数据集可以帮助自动驾驶车辆的目标检测器更好地识别这些边缘情况，从而提高自动驾驶车辆的安全性。

衍生相关工作

CODA 数据集的引入，推动了自动驾驶领域中的相关研究。基于 CODA 数据集，研究人员可以开发更鲁棒的目标检测器，例如开放世界目标检测器和异常检测器。这些目标检测器可以更好地识别训练数据中未出现过的对象，从而提高自动驾驶车辆的安全性。此外，CODA 数据集还可以用于评估自动驾驶车辆的其他感知模块，例如语义分割和场景理解模块，从而推动自动驾驶技术的全面发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集