BDD-X dataset
收藏Berkeley Deep Drive-X (eXplanation) Dataset
数据集概述
我们专注于生成文本描述和解释,例如以下配对:
- “Vehicle slows down”(描述)和“Because it is approaching an intersection and the light is red”(解释)
数据集下载
下载我们的 BDD-X dataset,包含以下内容:
- BDD-X-Annotations_v1.csv: 文本描述和解释的标注文件。
- {train, val, test}.txt: 训练、验证和测试集的划分文件。
数据集统计
我们的数据集包含超过77小时的驾驶视频,共6,970个视频。视频在多种驾驶条件下拍摄,例如白天/夜晚、高速公路/城市/乡村、夏季/冬季等。每个视频平均时长40秒,包含约3-4个动作,如加速、减速、右转等,所有动作都带有描述和解释。数据集包含超过26,000个活动,超过840万帧。我们提供了训练集、验证集和测试集,分别包含5,597、717和656个视频。
数据收集
Berkeley DeepDrive dataset
我们的解释数据集建立在Berkeley Deep Drive数据集之上,该数据集通过人类驾驶车辆的仪表盘摄像头收集。该数据集包含约40秒长的仪表盘摄像头视频,由安装在车辆挡风玻璃后方的单个前视摄像头捕捉。视频主要在城市驾驶中拍摄,涵盖各种天气条件,包括白天和夜间。数据集还包括在其他道路类型上的驾驶,如住宅道路(有或无车道标记),并包含所有典型的驾驶员活动,如保持在车道内、转弯、变道等。除了视频数据外,数据集还提供了一系列时间戳传感器测量值,如车辆的速度、航向和GPS位置。
标注提示
我们的标注过程如下:我们提供一个驾驶视频,并要求人类标注者想象自己是一名驾驶教练。我们特别选择熟悉美国驾驶规则的标注者。标注者需要描述驾驶员正在做什么(尤其是在行为改变时)以及为什么,从驾驶教练的角度出发。每个描述的动作都必须伴随开始和结束时间戳。标注者可以在视频中暂停、快进和后退,以寻找有趣且合理的活动。
引用
如果您发现此数据集有用,请引用此论文(并参考数据集为Berkeley DeepDrive eXplanation或BDD-X数据集):
@article{kim2018textual, title={Textual Explanations for Self-Driving Vehicles}, author={Kim, Jinkyu and Rohrbach, Anna and Darrell, Trevor and Canny, John and Akata, Zeynep}, journal={Proceedings of the European Conference on Computer Vision (ECCV)}, year={2018} }




