simlingo
收藏SimLingo数据集概述
数据集简介
- 名称: SimLingo Dataset
- 类型: 视觉问答、机器人技术
- 语言: 英语
- 标签: 自动驾驶、视觉问答(VQA)、评论、视觉语言动作(VLA)
- 许可证: other
数据集统计
- 规模: 3,308,315个样本
- 场景多样性: 覆盖38种复杂场景,包括城市交通、违反交通规则的参与者、高速公路高速驾驶
- 评估重点: 短路线,每条路线包含1个场景(62.1%)或3个场景(37.9%)
数据类型
- RGB图像: 1024x512前视摄像头图像
- 增强RGB图像: 1024x512前视摄像头图像,带有随机偏移和相机方向偏移
- LiDAR点云: LAZ格式
- 测量数据: 车辆状态、模拟器状态和传感器读数(JSON格式)
- 边界框: 场景中每个物体的详细信息
- 语言标注: 包括评论、指令跟随数据和VQA数据
数据集结构
data/: 原始传感器数据(RGB、LiDAR、测量数据、边界框)commentary/: 驾驶决策的自然语言描述dreamer/: 指令跟随数据,每个样本包含多个指令/动作对drivelm/: 基于DriveLM的VQA数据
下载与使用
-
完整下载: bash git clone https://huggingface.co/datasets/RenzKa/simlingo cd simlingo git lfs pull
-
单文件下载: bash wget https://huggingface.co/datasets/RenzKa/simlingo/resolve/main/[filename].tar.gz
-
解压: bash mkdir -p database/simlingo for file in *.tar.gz; do tar -xzf "$file" -C database/simlingo/ done
引用
bibtex @inproceedings{renz2025simlingo, title={SimLingo: Vision-Only Closed-Loop Autonomous Driving with Language-Action Alignment}, author={Renz, Katrin and Chen, Long and Arani, Elahe and Sinavski, Oleg}, booktitle={Conference on Computer Vision and Pattern Recognition (CVPR)}, year={2025}, } @inproceedings{sima2024drivelm, title={DriveLM: Driving with Graph Visual Question Answering}, author={Chonghao Sima and Katrin Renz and Kashyap Chitta and Li Chen and Hanxue Zhang and Chengen Xie and Jens Beißwenger and Ping Luo and Andreas Geiger and Hongyang Li}, booktitle={European Conference on Computer Vision}, year={2024}, }




