five

Bench2Drive|自动驾驶数据集|数据集评估数据集

收藏
arXiv2024-06-06 更新2024-06-21 收录
自动驾驶
数据集评估
下载链接:
https://thinklab-sjtu.github.io/Bench2Drive/
下载链接
链接失效反馈
资源简介:
Bench2Drive是由上海交通大学人工智能与计算机科学与工程学院创建的一个大型数据集,包含200万个完全标注的帧,来源于10000个短片段,均匀分布在44个交互场景、23种天气和12个城镇中。该数据集通过CARLA v2收集,旨在为全自动驾驶(FSD)提供一个全面、真实和公平的测试环境。创建过程中,数据集采用了先进的专家模型Think2Drive进行数据收集和标注。Bench2Drive的应用领域广泛,主要用于评估端到端自动驾驶(E2E-AD)系统的多重能力,解决现有评估方法中存在的不足,如开放环路评估的局限性和闭环评估中的高变异性。
提供机构:
上海交通大学人工智能与计算机科学与工程学院
创建时间:
2024-06-06
AI搜集汇总
数据集介绍
main_image_url
构建方式
Bench2Drive数据集的构建方式旨在解决现有端到端自动驾驶(E2E-AD)系统评估方法的不足。该数据集由2百万个完全标注的帧组成,这些帧从10000个视频片段中收集,这些片段均匀分布在CARLA v2模拟器中的44种交互场景下,包括切入、超车、绕道等,以及23种天气条件和12个城镇环境。每个视频片段大约150米长,包含一个特定的场景,确保了数据集的多样性和覆盖范围。
特点
Bench2Drive数据集的特点在于其全面性和多样性。它提供了220条评估路线,每条路线针对一个特定的驾驶场景,并涵盖了不同的城镇和天气条件。这种设计允许对每个驾驶技能进行隔离评估,从而提供了更详细和准确的分析。此外,数据集的规模和多样性确保了所有自动驾驶系统在相似的条件下接受训练,这对于算法级别的公平比较至关重要。
使用方法
Bench2Drive数据集的使用方法涉及使用官方训练数据集进行模型的训练,然后使用评估工具包对模型的驾驶技能进行评估。评估协议要求E2E-AD模型在不同位置和天气条件下通过44个交互场景。评估工具包包括220条评估路线,每条路线长度约为150米,包含一个特定的驾驶场景。评估指标包括成功率和驾驶评分,用于衡量模型的驾驶性能和遵守交通规则的能力。
背景与挑战
背景概述
随着自动驾驶技术的飞速发展,端到端自动驾驶(E2E-AD)系统因其数据驱动下的可扩展性而成为研究热点。然而,现有的E2E-AD方法大多在开放环路的日志回放方式下进行评估,使用L2误差和碰撞率作为指标,这无法完全反映算法的驾驶性能。为了解决这一问题,Bench2Drive应运而生,这是首个用于评估E2E-AD系统多功能的闭环评估基准。该数据集由上海交通大学人工智能与计算机科学与工程系的研究团队创建,包含200万个完全标注的帧,涵盖44种交互场景、23种天气和12个城镇,旨在提供一个全面、真实和公平的测试环境。
当前挑战
Bench2Drive数据集面临的挑战包括:1)所解决的领域问题是E2E-AD系统的闭环评估,目前的评估方法大多在开放环路下进行,无法充分反映算法的驾驶性能;2)构建过程中所遇到的挑战包括数据集的多样性、标注的准确性以及评估协议的公平性。为了应对这些挑战,Bench2Drive设计了220条短路线,每条路线包含一个特定的驾驶场景,以实现对个别技能的隔离评估,并减少驾驶评分指标的方差,从而提供更准确和有意义的性能比较。
常用场景
经典使用场景
Bench2Drive数据集作为首个封闭式端到端自动驾驶系统多能力评估基准,为自动驾驶领域的研究提供了一个全新的视角。该数据集官方训练数据由200万个完全注释的帧组成,涵盖了44种交互式场景、23种天气和12个城镇,确保了训练数据的多样性和丰富性。在评估协议中,E2E-AD模型需要在不同位置和天气条件下通过44个交互式场景,共计220条路线,从而提供了对不同情况下驾驶能力的全面且解耦的评估。
实际应用
Bench2Drive数据集的实际应用场景广泛,包括但不限于自动驾驶系统的训练和评估、自动驾驶技术的研发和改进等。通过使用Bench2Drive数据集进行训练和评估,可以更准确地了解自动驾驶系统在不同场景下的驾驶能力,从而推动自动驾驶技术的发展。此外,Bench2Drive数据集还可以用于自动驾驶领域的教育和培训,帮助学生和研究人员更好地理解和掌握自动驾驶技术。
衍生相关工作
基于Bench2Drive数据集,研究人员可以开展一系列相关的工作,例如开发新的E2E-AD算法、设计更有效的训练策略、改进评估方法等。此外,Bench2Drive数据集还可以用于其他相关领域的研究,例如交通预测、路径规划、决策制定等。通过不断探索和应用Bench2Drive数据集,可以推动自动驾驶领域的进一步发展,并为相关领域的研究提供新的思路和方向。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录