Cosmos-Drive-Dreams Dataset
收藏Cosmos-Drive-Dreams 数据集概述
数据集基本信息
- 名称: Cosmos-Drive-Dreams Dataset
- 类型: 合成驾驶数据
- 数据量:
- 真实采集的10秒视频片段: 5,843个
- 合成的视频样本: 81,802个
- 数据内容:
- 包含标签数据: HDMap、BBox和LiDAR
- 合成的视频: 每段121帧,涵盖多种具有挑战性的场景(如雨天、雪天、雾天等)
数据集特点
- 多样性: 涵盖多种现实中难以获取的复杂驾驶场景
- 商业授权: 可用于商业和非商业用途
- 配套工具: 提供可视化、标签编辑和格式转换工具
数据获取
- 下载方式: 即将发布
- 详细文档: Huggingface页面
相关资源
- 开源模型:
- Cosmos-7B-AV-Sample
- Cosmos-7B-Multiview-AV-Sample
- Cosmos-Transfer1-7B-Sample-AV
- Cosmos-7B-Single2Multiview-Sample-AV
- 工具包: 提供数据可视化、标签编辑和格式转换功能
数据处理流程
- 预处理: 从RDS-HQ数据集渲染条件视频
- 提示重写: 使用VLM生成多样化的文本提示
- 视频生成:
- 单视图视频生成
- 多视图视频扩展
- 过滤: 即将发布
引用文献
bibtex @misc{nvidia2025cosmosdrivedreams, title = {Cosmos-Drive-Dreams: Scalable Synthetic Driving Data Generation with World Foundation Models}, author = {Ren, Xuanchi and Lu, Yifan and Cao, Tianshi and Gao, Ruiyuan and Huang, Shengyu and Sabour, Amirmojtaba and Shen, Tianchang and Pfaff, Tobias and Wu, Jay Zhangjie and Chen, Runjian and Kim, Seung Wook and Gao, Jun and Leal-Taixe, Laura and Chen, Mike and Fidler, Sanja and Ling, Huan} year = {2025}, url = {https://arxiv.org/abs/2506.09042} }
bibtex @misc{nvidia2025cosmostransfer1, title = {Cosmos Transfer1: World Generation with Adaptive Multimodal Control}, author = {NVIDIA}, year = {2025}, url = {https://arxiv.org/abs/2503.14492} }




