five

CARLA Leaderboard 2.0 数据集|自动驾驶数据集|城市驾驶数据集

收藏
arXiv2024-12-13 更新2024-12-14 收录
自动驾驶
城市驾驶
下载链接:
https://github.com/autonomousvision/carla_garage
下载链接
链接失效反馈
资源简介:
CARLA Leaderboard 2.0 数据集是由蒂宾根大学创建的,用于支持端到端自动驾驶系统的训练和评估。该数据集包含531,000帧数据,涵盖了RGB图像、LiDAR点云以及用于训练的标签,如路径检查点、专家目标速度和辅助标签。数据集的创建过程利用了PDM-Lite规划器,该规划器能够解决CARLA Leaderboard 2.0中的复杂场景。数据集的应用领域主要集中在自动驾驶系统的训练和评估,旨在解决复杂城市环境中的驾驶问题,提升模型在高速、变道和障碍物处理等场景中的表现。
提供机构:
蒂宾根大学
创建时间:
2024-12-13
AI搜集汇总
数据集介绍
main_image_url
构建方式
CARLA Leaderboard 2.0 数据集的构建基于CARLA模拟器中的复杂驾驶场景,通过PDM-Lite规划器收集训练数据。该数据集包含了RGB图像、LiDAR点云以及路径检查点、目标速度和辅助标签等多种训练标签,共计337,000帧。数据集的构建过程中,采用了系统化的数据过滤策略,通过保留那些对模型目标标签有显著变化的帧,减少了数据集的规模,同时保持了关键信息的完整性。
特点
CARLA Leaderboard 2.0 数据集的特点在于其高复杂性和多样性,涵盖了38种不同的驾驶场景,包括高速行驶、偏离车道中心以及处理意外障碍等。数据集中的帧通过专家驾驶风格进行标注,确保了数据的实用性和可解释性。此外,数据集采用了创新的帧过滤方法,有效减少了冗余数据,提升了训练效率。
使用方法
CARLA Leaderboard 2.0 数据集适用于端到端自动驾驶模型的训练与评估,特别适合于模仿学习(IL)方法。用户可以通过该数据集训练模型,如TransFuser++,以预测目标速度和路径,并通过控制模块实现车辆的自动驾驶。数据集的多样性和复杂性使得模型能够在多种驾驶场景中进行泛化,从而提升其在实际驾驶环境中的表现。
背景与挑战
背景概述
CARLA Leaderboard 2.0 数据集是由Tübingen大学和Tübingen AI Center的研究团队在2024年推出的,旨在推动端到端自动驾驶系统的研究。该数据集的核心研究问题是如何在复杂的城市环境中实现高效的自动驾驶,特别是在高速行驶、偏离车道中心以及处理意外障碍等场景下。CARLA Leaderboard 2.0引入了38个新的复杂场景,这些场景对现有的自动驾驶模型提出了严峻挑战。通过该数据集,研究团队希望揭示训练数据集对模型性能的深远影响,并为未来的自动驾驶研究提供新的基准。
当前挑战
CARLA Leaderboard 2.0 数据集的构建和应用面临多重挑战。首先,数据集的复杂性使得传统的基于频率的分类权重方法不再适用,因为这些方法无法有效区分数据集中不同类别的实际重要性。其次,专家驾驶风格对模型性能的影响尚未得到充分研究,如何设计合适的专家行为以提高模型的泛化能力是一个关键问题。此外,数据集的规模和冗余性也是一个挑战,如何在减少数据集规模的同时保持模型性能是一个亟待解决的问题。最后,现有的评估指标存在设计缺陷,鼓励模型过早终止评估路线,这可能导致评估结果无法真实反映模型的实际驾驶能力。
常用场景
经典使用场景
CARLA Leaderboard 2.0 数据集主要用于端到端自动驾驶系统的训练与评估。该数据集包含了复杂的城市驾驶场景,如高速行驶、偏离车道中心以及处理意外障碍等,这些场景对自动驾驶系统的鲁棒性和适应性提出了极高的要求。通过使用该数据集,研究者可以训练和验证自动驾驶模型在多样化和复杂环境中的表现,尤其是在面对高难度驾驶任务时的应对能力。
实际应用
CARLA Leaderboard 2.0 数据集在实际应用中具有广泛的前景,尤其是在自动驾驶汽车的开发和测试阶段。通过该数据集,汽车制造商和科技公司可以模拟和评估自动驾驶系统在复杂城市环境中的表现,确保其在实际道路上的安全性和可靠性。此外,该数据集还可用于开发和验证新的驾驶策略和感知算法,推动自动驾驶技术的进一步发展。
衍生相关工作
CARLA Leaderboard 2.0 数据集的发布催生了一系列相关研究工作,特别是在端到端自动驾驶模型的训练和评估方面。例如,基于该数据集的研究者提出了新的数据过滤方法和专家驾驶风格调整策略,显著提升了模型的性能。此外,该数据集还推动了对现有评估指标的改进,提出了新的驾驶评分计算方法,以减少早期终止对评估结果的负面影响,为未来的自动驾驶挑战赛提供了更公平的评估标准。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Hang Seng Index

恒生指数(Hang Seng Index)是香港股市的主要股票市场指数,由恒生银行旗下的恒生指数有限公司编制。该指数涵盖了香港股票市场中最具代表性的50家上市公司,反映了香港股市的整体表现。

www.hsi.com.hk 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

SWaT Dataset

SWaT Dataset是一个用于工业控制系统(ICS)安全研究的数据集,包含了模拟的网络攻击和正常操作的数据。该数据集由新加坡科技设计大学(Singapore University of Technology and Design)发布,旨在帮助研究人员开发和测试用于检测工业控制系统中网络攻击的算法和模型。

itrust.sutd.edu.sg 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录