Extreme Driving Dataset
收藏数据集概述:Extreme Driving Dataset
基本信息
- 发布机构:清华大学车辆与运载学院智能底盘团队
- 数据集状态:即将随 arXiv 预印本发布
- 项目主页:https://sean-shiyuez.github.io/extreme-driving-dataset-web/
核心特点
- 专注极端、临界和恶劣驾驶场景的多模态驾驶数据集
- 采集自真实车辆平台,配备环绕相机、ZED 2i 立体相机(含深度)、前向激光雷达,并同步采集车辆动力学/GPS状态数据
- 包含人类驾驶数据以及团队自研的极端工况自动驾驶决策与控制功能
- 采用基于片段(episode)的组织格式,适用于端到端驾驶、世界模型、视觉-语言-动作(VLA)模型和轨迹规划研究
规模与组成
- 总片段数:589 个(训练集 + 验证集)
- 采样频率:所有模态统一为 4 Hz(250 ms 间隔)
- 场景类别:6 大顶层类别
场景分类
| 类别 | 描述 | 子场景数(训练/验证) |
|---|---|---|
| 正常驾驶(Normal_Driving) | 日常驾驶:跟车、变道、转弯、路口、隧道、减速等 | 25 / 5 |
| 复杂交通驾驶(Complex_Traffic_Driving) | 密集交通、匝道、立交桥、施工区、让行行人等 | 32 / 8 |
| 临界驾驶(Critical_Driving) | 紧急/极端场景:紧急制动、避让、碰撞避免转向等 | 11 / 2 |
| 低光照驾驶(Low_Light_Driving) | 夜间/曝光不足驾驶 | 5 / 2 |
| 雨天驾驶(Rain_Driving) | 雨天反射和能见度降低场景 | 11 / 1 |
| 雪天驾驶(Snow_Driving) | 雪地/积雪路面场景 | 2 / 1 |
目录结构
organized_dataset/ ├── train/ │ ├── Normal_Driving/ │ ├── Complex_Traffic_Driving/ │ ├── Critical_Driving/ │ ├── Low_Light_Driving/ │ ├── Rain_Driving/ │ └── Snow_Driving/ ├── val/ │ └── (same 6 categories) └── (utility scripts)
每个场景目录包含多个子场景,子场景下包含一个或多个片段目录(episode_<id>/)。
片段目录组成
episode_<id>/ ├── images/ │ ├── ZED_LEFT/ ZED_LEFT_.jpg │ ├── CAM_FRONT_LEFT/ FRONT_LEFT_.jpg │ ├── CAM_FRONT_RIGHT/ FRONT_RIGHT_.jpg │ ├── CAM_REAR_LEFT/ REAR_LEFT_.jpg │ ├── CAM_REAR_RIGHT/ REAR_RIGHT_.jpg │ └── CAM_REAR_CENTER/ REAR_CENTER_.jpg ├── zed/ │ └── right/ ZED_RIGHT_.jpg ├── depth/ DEPTH_.npy ├── lidar/ LIDAR_*.npy ├── metadata.jsonl ├── episode_annotation.json └── calibration.json
传感器模态
| 模态 | 路径 | 格式 | 说明 |
|---|---|---|---|
| 前左RGB | images/CAM_FRONT_LEFT/ |
.jpg |
环绕相机,前左视角 |
| 前右RGB | images/CAM_FRONT_RIGHT/ |
.jpg |
前右视角 |
| 后左RGB | images/CAM_REAR_LEFT/ |
.jpg |
后左视角 |
| 后右RGB | images/CAM_REAR_RIGHT/ |
.jpg |
后右视角 |
| 后中RGB | images/CAM_REAR_CENTER/ |
.jpg |
后中视角 |
| ZED 2i左RGB | images/ZED_LEFT/ |
.jpg |
立体左 |
| ZED 2i右RGB | zed/right/ |
.jpg |
立体右 |
| ZED 2i深度 | depth/ |
.npy (float32, 米) |
逐像素深度,对齐ZED左 |
| 前向激光雷达点云 | lidar/ |
.npy |
前向激光雷达逐帧点云 |
元数据字段(metadata.jsonl)
每帧包含:
车辆状态(state,长度7):
- 车速(km/h)
- 横摆角速度(deg/s 或 rad/s)
- 纵向原始加速度(g)
- 侧向原始加速度(g)
- GPS北向速度(m/s)
- GPS东向速度(m/s)
- GPS绝对航向角(deg)
动作标签(action,长度3):
- 下一帧在当前车体坐标系下的纵向位移Δx(m)
- 下一帧在当前车体坐标系下的侧向位移Δy(m,左为正)
- 航向变化Δyaw(rad)
其他字段:
images_1至images_4:四路关键图像(ZED左、前左、前右、后中)prompt:自然语言驾驶意图is_robot:始终为true
片段级标注(episode_annotation.json)
包含VLM辅助生成的:
- 天气、交通分析、路面状况
- 驾驶意图
- 危机评分(0-100)与危机等级(低/中/高/极高)
- 危险源列表、关注点列表、驾驶建议列表
- 置信度和自然语言总结
建议用途
- 端到端驾驶/行为克隆
- VLA/指令跟随驾驶
- 世界模型与未来预测
- 车辆动力学与底盘控制研究(侧偏角估计、极限操控、紧急机动建模)
- 立体/单目深度估计,激光雷达-相机融合基准测试
注意事项
calibration.json目前可能为空,传感器外参将在未来更新中发布- 深度图来自ZED 2i SDK,无效像素可能为0、
nan或inf prompt和annotation字段为VLM辅助生成,应作为软标签使用- 激光雷达仅为前向,无360°覆盖




