five

CARLA Leaderboard 2.0 数据集|自动驾驶数据集|城市驾驶数据集

收藏
arXiv2024-12-13 更新2024-12-14 收录
自动驾驶
城市驾驶
下载链接:
https://github.com/autonomousvision/carla_garage
下载链接
链接失效反馈
资源简介:
CARLA Leaderboard 2.0 数据集是由蒂宾根大学创建的,用于支持端到端自动驾驶系统的训练和评估。该数据集包含531,000帧数据,涵盖了RGB图像、LiDAR点云以及用于训练的标签,如路径检查点、专家目标速度和辅助标签。数据集的创建过程利用了PDM-Lite规划器,该规划器能够解决CARLA Leaderboard 2.0中的复杂场景。数据集的应用领域主要集中在自动驾驶系统的训练和评估,旨在解决复杂城市环境中的驾驶问题,提升模型在高速、变道和障碍物处理等场景中的表现。
提供机构:
蒂宾根大学
创建时间:
2024-12-13
AI搜集汇总
数据集介绍
main_image_url
构建方式
CARLA Leaderboard 2.0 数据集的构建基于CARLA模拟器中的复杂驾驶场景,通过PDM-Lite规划器收集训练数据。该数据集包含了RGB图像、LiDAR点云以及路径检查点、目标速度和辅助标签等多种训练标签,共计337,000帧。数据集的构建过程中,采用了系统化的数据过滤策略,通过保留那些对模型目标标签有显著变化的帧,减少了数据集的规模,同时保持了关键信息的完整性。
特点
CARLA Leaderboard 2.0 数据集的特点在于其高复杂性和多样性,涵盖了38种不同的驾驶场景,包括高速行驶、偏离车道中心以及处理意外障碍等。数据集中的帧通过专家驾驶风格进行标注,确保了数据的实用性和可解释性。此外,数据集采用了创新的帧过滤方法,有效减少了冗余数据,提升了训练效率。
使用方法
CARLA Leaderboard 2.0 数据集适用于端到端自动驾驶模型的训练与评估,特别适合于模仿学习(IL)方法。用户可以通过该数据集训练模型,如TransFuser++,以预测目标速度和路径,并通过控制模块实现车辆的自动驾驶。数据集的多样性和复杂性使得模型能够在多种驾驶场景中进行泛化,从而提升其在实际驾驶环境中的表现。
背景与挑战
背景概述
CARLA Leaderboard 2.0 数据集是由Tübingen大学和Tübingen AI Center的研究团队在2024年推出的,旨在推动端到端自动驾驶系统的研究。该数据集的核心研究问题是如何在复杂的城市环境中实现高效的自动驾驶,特别是在高速行驶、偏离车道中心以及处理意外障碍等场景下。CARLA Leaderboard 2.0引入了38个新的复杂场景,这些场景对现有的自动驾驶模型提出了严峻挑战。通过该数据集,研究团队希望揭示训练数据集对模型性能的深远影响,并为未来的自动驾驶研究提供新的基准。
当前挑战
CARLA Leaderboard 2.0 数据集的构建和应用面临多重挑战。首先,数据集的复杂性使得传统的基于频率的分类权重方法不再适用,因为这些方法无法有效区分数据集中不同类别的实际重要性。其次,专家驾驶风格对模型性能的影响尚未得到充分研究,如何设计合适的专家行为以提高模型的泛化能力是一个关键问题。此外,数据集的规模和冗余性也是一个挑战,如何在减少数据集规模的同时保持模型性能是一个亟待解决的问题。最后,现有的评估指标存在设计缺陷,鼓励模型过早终止评估路线,这可能导致评估结果无法真实反映模型的实际驾驶能力。
常用场景
经典使用场景
CARLA Leaderboard 2.0 数据集主要用于端到端自动驾驶系统的训练与评估。该数据集包含了复杂的城市驾驶场景,如高速行驶、偏离车道中心以及处理意外障碍等,这些场景对自动驾驶系统的鲁棒性和适应性提出了极高的要求。通过使用该数据集,研究者可以训练和验证自动驾驶模型在多样化和复杂环境中的表现,尤其是在面对高难度驾驶任务时的应对能力。
实际应用
CARLA Leaderboard 2.0 数据集在实际应用中具有广泛的前景,尤其是在自动驾驶汽车的开发和测试阶段。通过该数据集,汽车制造商和科技公司可以模拟和评估自动驾驶系统在复杂城市环境中的表现,确保其在实际道路上的安全性和可靠性。此外,该数据集还可用于开发和验证新的驾驶策略和感知算法,推动自动驾驶技术的进一步发展。
衍生相关工作
CARLA Leaderboard 2.0 数据集的发布催生了一系列相关研究工作,特别是在端到端自动驾驶模型的训练和评估方面。例如,基于该数据集的研究者提出了新的数据过滤方法和专家驾驶风格调整策略,显著提升了模型的性能。此外,该数据集还推动了对现有评估指标的改进,提出了新的驾驶评分计算方法,以减少早期终止对评估结果的负面影响,为未来的自动驾驶挑战赛提供了更公平的评估标准。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。

www.nrel.gov 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录