DAIR-V2X|自动驾驶数据集|车辆基础设施协同数据集

arXiv2022-04-12 更新2024-06-21 收录

自动驾驶

车辆基础设施协同

下载链接：

https://thudair.baai.ac.cn/index

下载链接

链接失效反馈

资源简介：

DAIR-V2X是由清华大学人工智能产业研究院(AIR)和百度公司联合创建的大规模多模态多视角数据集，专为车辆基础设施协同自动驾驶(VICAD)设计。该数据集包含71254个激光雷达帧和71254个相机帧，均来自真实场景并带有3D标注。数据集覆盖了城市道路、高速公路、交叉路口以及多种天气和光照条件下的驾驶区域。创建过程中，数据集通过专家标注确保了高质量的标注，并采用了隐私保护措施。该数据集主要用于解决车辆基础设施协同3D目标检测问题(VIC3D)，旨在通过车辆和基础设施的传感器输入协同定位和识别3D目标，同时考虑时间异步问题和数据传输成本。

提供机构：

清华大学人工智能产业研究院(AIR)

创建时间：

2022-04-12

AI搜集汇总

数据集介绍

构建方式

DAIR-V2X 数据集的构建是通过在真实的城市道路和高速公路上部署车辆传感器和基础设施传感器，并捕捉大量的激光雷达和相机帧来实现的。这些帧被精心标注，涵盖了多样化的场景、天气和光照条件，从而为车辆基础设施协同自动驾驶（VICAD）研究提供了丰富的数据基础。

特点

DAIR-V2X 数据集的特点在于它是一个大规模、多模态、多视角的数据集，包含了来自车辆和基础设施传感器的数据。它首次提供了真实的场景数据，用于解决车辆基础设施协同3D物体检测（VIC3D）问题。此外，该数据集还引入了时间补偿融合（TCLF）框架，以缓解车辆和基础设施传感器之间的时间异步问题。

使用方法

使用 DAIR-V2X 数据集的方法包括下载数据、代码和相关文档，然后根据研究需要选择合适的数据集子集进行实验。数据集被分为训练集、验证集和测试集，以便进行基准测试。在实验中，研究人员可以比较不同模态和融合方法的性能，并评估时间补偿融合框架的有效性。

背景与挑战

背景概述

在自动驾驶技术迅猛发展的今天，如何让车辆拥有更广阔的视野和更远的感知能力成为了一个重要的挑战。为了实现自动驾驶的最高级别——Level 5的完全自动驾驶，车辆与基础设施之间的合作被认为是必不可少的。然而，缺乏真实场景中的数据集，使得计算机视觉研究人员在处理车辆与基础设施合作相关的问题时遇到了困难。为了加速计算机视觉在车辆基础设施协同自动驾驶（VICAD）领域的研究与创新，清华大学人工智能产业研究院（AIR）与百度公司合作，于2021年发布了DAIR-V2X数据集。这是首个大规模、多模态、多视角的真实场景数据集，包含了71254个激光雷达帧和71254个相机帧，所有帧都带有3D标注。DAIR-V2X数据集的发布，为计算机视觉研究人员提供了一个宝贵的研究资源，对于推动VICAD领域的发展具有重要意义。

当前挑战

DAIR-V2X数据集面临的挑战主要包括：1) 所解决的领域问题，即车辆基础设施协同3D目标检测（VIC3D）问题。该问题需要考虑车辆与基础设施传感器之间的时间异步问题以及数据传输成本。2) 构建过程中所遇到的挑战，如如何确保数据集的真实性和标注的准确性，如何保护第三方隐私等。为了解决这些挑战，DAIR-V2X数据集提出了时间补偿延迟融合（TCLF）框架，该框架可以有效地缓解时间异步问题，并且提供了一种性能与带宽之间的权衡方法。此外，DAIR-V2X数据集还提供了VIC3D目标检测基准和单视角3D目标检测基准，为未来研究提供了参考。

常用场景

经典使用场景

DAIR-V2X数据集主要应用于自动驾驶领域，特别是在车辆与基础设施合作感知方面。该数据集提供了大量的真实场景数据，包括71254个LiDAR帧和71254个Camera帧，所有帧都带有3D标注。这使得研究人员能够利用车辆和基础设施的传感器输入，协同定位和识别3D对象。此外，数据集还包含了不同天气和光照条件下的场景，以及多样化的交通环境，为自动驾驶研究提供了丰富的数据支持。

实际应用

DAIR-V2X数据集在实际应用中具有广泛的应用前景。通过车辆与基础设施的合作感知，可以提高自动驾驶系统的安全性、可靠性和准确性。数据集还可以用于开发新的自动驾驶技术和算法，例如，通过分析数据集中的交通场景，可以优化车辆的控制策略，提高车辆的驾驶性能。此外，数据集还可以用于训练自动驾驶系统的感知模块，使其能够更好地适应不同的交通环境和天气条件。

衍生相关工作

DAIR-V2X数据集的发布，促进了车辆与基础设施合作感知领域的研究。基于该数据集，研究人员提出了多种融合框架和算法，例如时间补偿融合框架（TCLF），有效地解决了时间异步问题。此外，数据集还推动了多传感器融合技术的研究，为自动驾驶系统提供了更全面的感知能力。未来，随着自动驾驶技术的不断发展，DAIR-V2X数据集有望在更多领域得到应用，为自动驾驶技术的发展做出更大的贡献。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

LibriSpeech

LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库，由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物，并经过仔细分割和对齐。

OpenDataLab 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集，主要由非网络来源的内部数据构成，包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容，质量优异，信息密度可观。数据集适用于预训练或继续预训练用途，未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用，但建议先使用配套的预训练数据集对模型进行继续预训练后，再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据，以避免灾难性遗忘并加强模型表现。

huggingface 收录

WideIRSTD Dataset

WideIRSTD数据集包含七个公开数据集：SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV，以及由国防科技大学团队开发的数据集，包括模拟陆基和太空基数据，以及真实手动标注的太空基数据。数据集包含具有各种目标形状（如点目标、斑点目标、扩展目标）、波长（如近红外、短波红外和热红外）、图像分辨率（如256、512、1024、3200等）的图像，以及不同的成像系统（如陆基、空基和太空基成像系统）。

github 收录

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息，数据通过爬虫技术获取并整理成CSV格式，用于音乐数据挖掘和推荐系统构建。

github 收录

Houston2013, Berlin, Augsburg

本研究发布了三个多模态遥感基准数据集：Houston2013（高光谱和多光谱数据）、Berlin（高光谱和合成孔径雷达数据）和Augsburg（高光谱、合成孔径雷达和数字表面模型数据）。这些数据集用于土地覆盖分类，旨在通过共享和特定特征学习模型（S2FL）评估多模态基线。数据集包含不同模态和分辨率的图像，适用于评估和开发新的遥感图像处理技术。

arXiv 收录