PhysicalAI-Autonomous-Vehicle-Cosmos-Synthetic

Name: PhysicalAI-Autonomous-Vehicle-Cosmos-Synthetic
Creator: NVIDIA
Published: 2025-06-10 19:59:08
License: 暂无描述

Hugging Face2025-06-10 更新2025-06-11 收录

下载链接：

https://huggingface.co/datasets/nvidia/PhysicalAI-Autonomous-Vehicle-Cosmos-Synthetic

下载链接

链接失效反馈

官方服务：

资源简介：

这个数据集包含了从RDS-HQ数据集中提取的5843个10秒视频片段的标签，以及通过Cosmos-Drive-Dreams模型根据这些标签生成的81802个合成视频样本。这些合成视频时长为121帧，能够捕捉到在现实世界中可能不易获得的多种复杂驾驶场景，如雨天、雪天、雾天等。数据集适用于商业和非商业自动驾驶车辆模型训练。数据集由NVIDIA Corporation创建，遵循CC BY 4.0许可协议。

This dataset contains labels for 5,843 10-second video clips extracted from the RDS-HQ dataset, along with 81,802 synthetic video samples generated by the Cosmos-Drive-Dreams model based on these labels. These synthetic videos have a duration of 121 frames and can capture a variety of complex driving scenarios that are rarely obtainable in real-world environments, such as rainy, snowy, and foggy weather conditions. The dataset is suitable for training both commercial and non-commercial autonomous driving vehicle models. It was created by NVIDIA Corporation and released under the CC BY 4.0 license agreement.

提供机构：

NVIDIA

创建时间：

2025-06-03

搜集汇总

数据集介绍

构建方式

在自动驾驶技术迅猛发展的背景下，PhysicalAI-Autonomous-Vehicle-Cosmos-Synthetic数据集通过先进的合成数据生成技术构建而成。该数据集利用高保真模拟环境，模拟了多样化的驾驶场景和复杂交通条件，涵盖了城市道路、高速公路及恶劣天气等多种情境。数据生成过程结合了物理引擎和人工智能算法，确保了场景的真实性和数据的多样性，为自动驾驶系统的训练和验证提供了丰富且可靠的合成数据资源。

特点

该数据集的核心特点在于其高度逼真的合成数据和广泛的场景覆盖。它包含了多模态传感器数据，如摄像头图像、激光雷达点云和雷达信号，模拟了真实世界中的各种驾驶挑战。数据集中还注入了丰富的标注信息，包括物体检测、语义分割和轨迹预测等，支持多种自动驾驶任务的开发。其合成性质允许无限生成数据，避免了真实数据收集中的隐私和成本问题，同时保持了数据的一致性和高质量。

使用方法

研究人员和工程师可通过HuggingFace平台直接访问该数据集，按照提供的指南加载和处理数据。数据集支持主流深度学习框架，如PyTorch和TensorFlow，用户可将其用于模型训练、验证和测试。典型应用包括感知模块的开发、决策算法的优化以及系统级别的仿真测试。使用前需仔细阅读许可协议，确保符合CC-BY-4.0的要求，并正确引用数据来源，以保障学术和商业应用的合规性。

背景与挑战

背景概述

自动驾驶领域的发展亟需大规模高质量仿真数据支撑，PhysicalAI-Autonomous-Vehicle-Cosmos-Synthetic数据集由NVIDIA公司主导构建，专注于通过合成数据技术解决真实道路测试成本高、边界场景稀缺的核心问题。该数据集依托物理引擎与生成式AI技术，构建了高度拟真的多模态驾驶场景，为感知决策算法的训练与验证提供了重要基础设施，显著推动了自动驾驶系统在复杂环境下的泛化能力研究。

当前挑战

该数据集旨在攻克自动驾驶系统中极端天气、光照突变、传感器故障等长尾场景的模拟难题，其构建过程面临多重挑战：一是需平衡物理仿真精度与计算效率的矛盾；二是要确保合成数据与真实数据的域差距最小化；三是需构建涵盖多智能体交互复杂性的动态场景，这对场景生成算法的多样性与可控性提出了极高要求。

常用场景

经典使用场景

在自动驾驶仿真领域，PhysicalAI-Autonomous-Vehicle-Cosmos-Synthetic数据集通过高保真合成数据模拟复杂交通场景，为感知与决策算法提供标准化测试环境。研究者利用其多模态传感器数据流，系统验证车辆在极端天气、夜间照明及突发障碍等边缘案例中的响应能力，显著提升模型泛化性能。

解决学术问题

该数据集有效解决了自动驾驶研究中真实数据稀缺与标注成本高昂的瓶颈问题，为端到端驾驶系统开发提供可扩展的数据基础。其精确的物理引擎仿真与场景标注体系，助力学术界突破感知模型鲁棒性、多智能体交互决策等核心挑战，推动安全可信自动驾驶理论框架的完善。

衍生相关工作

基于该数据集衍生了多个里程碑式研究，例如DriveDreamer系列工作通过时空联合生成技术提升场景连续性，NVidia推出的DriveSim平台进一步扩展了气象与光影物理建模。这些成果构建了合成数据驱动的自动驾驶研发新范式，持续推动仿真与现实数据的域自适应技术发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集