five

nuPlan|自动驾驶数据集|模拟基准数据集

收藏
arXiv2024-12-11 更新2024-12-25 收录
自动驾驶
模拟基准
下载链接:
http://arxiv.org/abs/2412.09647v1
下载链接
链接失效反馈
资源简介:
nuPlan数据集是由上海交通大学开发的,用于评估端到端自动驾驶模型的闭环反应性模拟基准。该数据集基于大规模真实世界驾驶数据,将长距离驾驶旅程分割成多个可管理的驾驶场景,每个场景包含高层次的导航信息和传感器数据。nuPlan数据集的主要目的是解决现有模拟器在真实性和反应性方面的不足,特别是在高度交互的驾驶场景中。通过提供高保真度的传感器数据和反应性行为模拟,nuPlan数据集为自动驾驶模型的评估和开发提供了强有力的支持。
提供机构:
上海交通大学计算机科学与工程系 & 人工智能学院 & 人工智能重点实验室
创建时间:
2024-12-11
AI搜集汇总
数据集介绍
main_image_url
构建方式
nuPlan数据集的构建基于大规模真实世界驾驶数据,通过将长时间驾驶旅程划分为多个可管理的驾驶场景。每个场景包含高级导航信息(如目标点和路线规划)以及沿专家轨迹收集的传感器数据。为了增强数据集的交互性和反应性,研究者引入了Bench2Drive-R生成框架,该框架通过分离行为控制器和生成渲染器,模拟周围车辆的反应,并生成高保真的传感器图像。生成渲染器采用扩散模型,并结合噪声调制和空间一致性机制,确保图像序列的时空一致性。
特点
nuPlan数据集的特点在于其反应性闭环评估能力,能够模拟真实世界中的驾驶场景,并提供高保真的传感器数据。数据集不仅包含静态背景信息,还通过行为控制器动态生成周围车辆的反应,从而模拟复杂的交通交互场景。此外,生成渲染器通过检索机制和3D位置编码,确保场景级别的渲染保真度,避免生成虚假的视觉伪影。数据集的设计特别适用于端到端自动驾驶模型的闭环评估,能够有效捕捉模型在复杂交通场景中的规划能力。
使用方法
nuPlan数据集的使用方法主要包括闭环仿真和端到端自动驾驶模型的评估。研究者可以将Bench2Drive-R框架集成到nuPlan中,通过生成高保真的传感器图像序列,模拟自动驾驶车辆在不同驾驶行为下的反应。数据集支持多视角传感器图像的生成,并通过行为控制器动态更新场景中的车辆状态。评估时,研究者可以通过比较生成图像的质量、感知模型的性能以及自动驾驶模型的规划能力,验证模型在真实世界中的表现。此外,数据集还支持开放环评估,通过测量预测轨迹与专家轨迹之间的位移误差,评估模型的规划精度。
背景与挑战
背景概述
nuPlan数据集是由上海交通大学的研究团队于2024年提出的,旨在为端到端自动驾驶(E2E-AD)模型提供一个反应式闭环评估框架。该数据集的核心研究问题在于如何通过生成模型将真实世界的数据转化为具有高保真度和一致性的传感器数据,以支持自动驾驶模型的闭环仿真。nuPlan的提出填补了现有仿真器(如CARLA)与真实世界之间的差距,特别是在传感器渲染和行为模拟方面的不足。通过结合生成模型和行为控制器,nuPlan能够模拟周围车辆的反应,从而为自动驾驶系统提供更加真实的测试环境。该数据集对自动驾驶领域的影响力在于其首次将生成模型与闭环仿真相结合,为E2E-AD模型的评估提供了新的基准。
当前挑战
nuPlan数据集在构建过程中面临的主要挑战包括两个方面。首先,在领域问题方面,现有的自动驾驶评估方法存在显著的局限性。开环评估依赖于专家轨迹,无法反映模型在复杂交互场景中的规划能力;而闭环仿真器虽然能够提供反应式评估,但其渲染和行为模拟与真实世界存在较大差距。nuPlan通过生成模型解决了这一问题,但如何在生成过程中保持时空一致性仍是一个挑战。其次,在数据集构建过程中,生成模型的设计需要兼顾图像保真度、控制依从性和时空一致性。特别是在自回归生成过程中,如何避免误差累积导致的生成质量下降是一个关键问题。此外,如何在生成过程中引入参考图像以消除背景不确定性,同时避免对参考图像的过度依赖,也是构建过程中的一大挑战。
常用场景
经典使用场景
nuPlan数据集在自动驾驶领域中被广泛用于端到端驾驶模型的闭环评估。其经典使用场景包括通过生成模型模拟真实世界的驾驶环境,评估自动驾驶系统在复杂交通场景中的反应能力。通过结合行为控制器和生成渲染器,nuPlan能够提供高保真的传感器数据,模拟动态交通流中的车辆交互,从而为自动驾驶算法的开发和验证提供可靠的测试平台。
解决学术问题
nuPlan数据集解决了自动驾驶研究中端到端模型评估的难题。传统的开环评估方法依赖于专家轨迹的对比,无法反映模型在动态环境中的规划能力。而现有的闭环仿真器如CARLA在渲染和行为模拟上与现实世界存在较大差距。nuPlan通过生成模型实现了高保真、反应式的闭环仿真,能够准确评估模型在复杂交通场景中的表现,填补了现有评估方法的空白。
衍生相关工作
nuPlan数据集衍生了许多相关研究工作,特别是在生成模型和闭环仿真领域。例如,基于nuPlan的Bench2Drive-R框架通过引入行为控制器和生成渲染器,实现了高保真的反应式闭环仿真。此外,许多研究利用nuPlan数据集开发了新的生成模型,如MagicDrive和Panacea,这些模型通过生成多样化的驾驶场景,推动了自动驾驶感知和规划算法的进步。nuPlan还为闭环仿真平台如NAVSIM提供了数据支持,进一步扩展了其在自动驾驶研究中的应用范围。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

2020年中西亚30m Landsat TM/OLI土壤盐渍化分布数据集

该土壤盐渍化产品覆盖范围涵盖中亚五国、西亚土耳其、阿富汗及伊朗全境,该产品使用Landsat、SPOT数据遥感数据解译得到,其中大部分区域使用Landsat数据,部分重点监测区域采用SPOT数据进行补充,利用多源、多时相遥感影像,结合遥感参数、地形地貌和自然环境因子,采用面向对象的遥感分类方法,应用影像分割、决策树分类、变化监测等关键技术完成。该2020年30米空间分辨率数据可用于中西亚盐渍化时空变化分析及资源利用评估,可为农牧业、林业、环境保护、水资源保护、环境保护等政府相关部门的规划与管理提供基础信息。

地球大数据科学工程 收录

TruckV2X

TruckV2X数据集是首个以卡车为中心的多模态和多代理协作感知数据集,旨在解决卡车在自动驾驶中面临的独特感知挑战。该数据集利用LiDAR和摄像头进行多模态感知,并包括拖拉机、拖车、CAV和RSU等多代理协作。数据集提供了64个场景,包括88,396帧LiDAR点云、一百万张相机图像和1.18百万个3D边界框注释。该数据集为开发具有增强遮挡处理能力的协作感知系统奠定了基础,并加速了多代理自动驾驶卡车系统的部署。

arXiv 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

Global Burden of Disease Study (GBD)

全球疾病负担研究(GBD)数据集提供了全球范围内疾病、伤害和风险因素的详细统计数据。该数据集包括了各种健康指标,如死亡率、发病率、伤残调整生命年(DALYs)等,涵盖了多个国家和地区。数据集还提供了不同年龄组、性别和时间段的详细分析。

ghdx.healthdata.org 收录

Population and Housing Census of 2007 - Ethiopia

Geographic coverage --------------------------- National coverage Analysis unit --------------------------- Household Person Housing unit Universe --------------------------- The census has counted people on dejure and defacto basis. The dejure population comprises all the persons who belong to a given area at a given time by virtue of usual residence, while under defacto approach people were counted as the residents of the place where they found. In the census, a person is said to be a usual resident of a household (and hence an area) if he/she has been residing in the household continuously for at least six months before the census day or intends to reside in the household for six months or longer. Thus, visitors are not included with the usual (dejure) population. Homeless persons were enumerated in the place where they spent the night on the enumeration day. The 2007 census counted foreign nationals who were residing in the city administration. On the other hand all Ethiopians living abroad were not counted. Kind of data --------------------------- Census/enumeration data [cen] Mode of data collection --------------------------- Face-to-face [f2f] Research instrument --------------------------- Two type sof questionnaires were used to collect census data: i) Short questionnaire ii) Long questionnaire Unlike the previous censuses, the contents of the short and long questionnaires were similar both for the urban and rural areas as well as for the entire city. But the short and the long questionnaires differ by the number of variables they contained. That is, the short questionnaire was used to collect basic data on population characteristics, such as population size, sex, age, language, ethnic group, religion, orphanhood and disability. Whereas the long questionnaire includes information on marital status, education, economic activity, migration, fertility, mortality, as well as housing stocks and conditions in addition to those questions contained in a short questionnaire.

catalog.ihsn.org 收录