dasgringuen/assettoCorsaGym

Name: dasgringuen/assettoCorsaGym
Creator: dasgringuen
Published: 2024-11-13 23:40:22
License: 暂无描述

Hugging Face2024-11-13 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/dasgringuen/assettoCorsaGym

下载链接

链接失效反馈

官方服务：

资源简介：

AssettoCorsaGym数据集是一个用于自动驾驶、强化学习和模仿学习研究的数据集。数据集包含6400万步的数据，其中230万步来自人类驾驶员，其余来自Soft Actor-Critic (SAC)策略。数据收集涉及15名驾驶员，每名驾驶员在每条赛道和每辆车上至少完成五圈。参与者包括一名职业电子竞技驾驶员、四名专家、五名休闲驾驶员和五名初学者。数据集的结构包括赛道、车辆和驾驶员/策略的数据，每个数据实例包含来自赛车模拟器的50Hz的遥测数据，如速度、位置、加速度和控制输入（转向、油门、刹车）。数据集的创建目的是为了推动自动驾驶、强化学习和模仿学习的研究，数据集由UC San Diego和Graz University of Technology的研究人员策划，采用CC BY 4.0许可证。

提供机构：

dasgringuen

原始信息汇总

Assetto Corsa Gym Dataset

数据集概述

名称: Assetto Corsa Gym Dataset
大小: 10M<n<100M
语言: 英语
许可证: CC BY 4.0
标签: RL, MBRL, autonomous driving, racing, MPC
任务类别: other

数据集描述

数据集摘要

包含6400万步数据，其中230万步来自人类驾驶员，其余来自Soft Actor-Critic (SAC)策略。
数据收集涉及15名驾驶员，每人至少完成五圈赛道和车辆。
参与者包括一名职业电竞驾驶员、四名专家、五名休闲驾驶员和五名初学者。

支持的任务和排行榜

自动驾驶
强化学习
行为克隆
模仿学习

语言

英语

数据集结构

数据实例

每个数据实例包括来自赛车模拟器的遥测数据，频率为50Hz，如速度、位置、加速度和控制输入（转向、油门、刹车）。

数据字段

请参见: https://github.com/dasGringuen/assetto_corsa_gym/blob/main/assetto_corsa_gym/assetto-corsa-autonomous-racing-plugin/plugins/sensors_par/structures.py

数据分割

数据按车辆和赛道进行分割。

数据集创建

策划理由

该数据集旨在推动自动驾驶、强化学习和模仿学习领域的研究。
通过提供包含人类驾驶数据和Soft Actor-Critic (SAC)策略生成数据的多样的数据集。

源数据

初始数据收集和归一化: 数据从赛车模拟器中收集。人类驾驶员至少完成五圈赛道和车辆，而SAC策略从零开始训练，并记录其重放缓冲区。
源语言生产者: 人类驾驶员，包括职业电竞驾驶员、专家、休闲驾驶员和初学者。

注释

注释过程: 数据在收集过程中自动标记，以区分人类和SAC策略数据。
注释者: 由UC San Diego和Graz University of Technology的研究团队注释。

个人和敏感信息

数据集中不包含任何个人身份信息。驾驶员被匿名化，仅通过driver_id标识。

使用数据时的考虑

数据集的社会影响

该数据集旨在通过提供多样化的驾驶数据来训练机器学习模型，从而促进更安全和更高效的自动驾驶系统的发展。

偏见的讨论

数据集包含广泛的驾驶技能，但仍可能存在基于有限数量的人类参与者和他们特定驾驶风格的偏见。
每个赛道和车辆的圈数不平衡，可能会影响在此数据集上训练的模型的泛化能力。
赛道和车辆的选择以及数据收集的具体条件也可能引入研究人员在使用此数据集时应意识到的偏见。

其他已知限制

有限的赛道和车辆数量
模拟驾驶环境可能无法完全捕捉现实世界的驾驶条件

附加信息

数据集策展人

由UC San Diego和Graz University of Technology的研究人员策展。

许可证信息

CC BY 4.0

引用信息

@misc{remonda2024simulation, title={A Simulation Benchmark for Autonomous Racing with Large-Scale Human Data}, author={Adrian Remonda and Nicklas Hansen and Ayoub Raji and Nicola Musiu and Marko Bertogna and Eduardo E. Veas and Xiaolong Wang}, booktitle={38th Annual Conference on Neural Information Processing Systems (Submission)}, year={2024} }

贡献

感谢@dasGringuen添加此数据集。

搜集汇总

数据集介绍

构建方式

在自动驾驶与强化学习研究领域，高质量仿真数据的获取至关重要。AssettoCorsaGym数据集的构建依托于专业赛车模拟器环境，通过系统化采集流程整合了人类驾驶员与智能策略的驾驶行为。具体而言，研究团队招募了十五名技能各异的驾驶员，涵盖职业电竞选手、专家级、休闲型及初学者等多层次群体，每位驾驶员需在指定赛道与车辆组合下完成至少五圈行驶。同时，利用软演员-评论家算法从零开始训练策略模型，并记录其回放缓冲区中的交互数据。整个采集过程以五十赫兹频率同步记录车辆遥测信息，包括速度、位置、加速度及操控输入等关键参数，最终形成包含六千四百万步的庞大数据集合，其中人类驾驶数据占二百三十万步。

特点

该数据集的核心特征体现在其多层次、结构化的数据构成与高度仿真的环境表征上。数据内容深度融合了人类驾驶员的真实操作模式与强化学习策略的探索行为，为模仿学习与行为克隆研究提供了丰富的对比样本。数据集以赛道、车辆及数据来源为维度进行层级化组织，每条数据实例均包含精细的车辆动力学状态与操控指令，模拟环境的高度物理真实性确保了数据在自动驾驶算法验证中的可靠性。此外，数据采集覆盖了多样化的驾驶技能水平与车辆赛道组合，虽在样本平衡性上存在局限，但其规模与多样性仍为模型泛化能力评估提供了重要基础。

使用方法

针对自动驾驶与强化学习领域的模型开发与评估，该数据集支持多种典型应用范式。研究者可通过标准数据加载接口访问结构化存储的遥测数据，依据赛道、车辆及驾驶员类型等元数据进行灵活的子集划分。在强化学习场景中，数据集可直接作为离线训练资源，用于策略初始化或行为正则化；在模仿学习任务中，人类驾驶轨迹可作为专家示范，用于监督式策略训练。使用过程中需注意数据分布的固有偏差，建议结合交叉验证与领域适配技术以提升模型鲁棒性。数据集遵循知识共享许可协议，允许在注明来源的前提下用于学术研究与算法开发。

背景与挑战

背景概述

在自动驾驶与强化学习领域，模拟环境数据集对于算法验证与模型训练具有关键价值。AssettoCorsaGym数据集由加州大学圣地亚哥分校与格拉茨理工大学的研究团队于近年联合创建，旨在为自动驾驶、强化学习及模仿学习提供高质量的赛车模拟数据。该数据集的核心研究问题聚焦于如何通过融合人类驾驶员与智能体策略的多样化驾驶行为数据，提升自动驾驶系统在复杂动态环境中的决策与控制能力。其包含的6400万步数据，涵盖专业电竞选手至初学者的多层级驾驶表现，对推动自动驾驶算法的鲁棒性与泛化性研究产生了显著影响。

当前挑战

该数据集致力于解决自动驾驶领域在高度动态的赛车环境中实现精准控制与安全决策的挑战，具体涉及多智能体交互、实时轨迹规划以及极端驾驶条件下的稳定性保持等问题。在构建过程中，研究团队面临数据采集的复杂性挑战，包括协调不同技能水平的人类驾驶员完成标准化实验、平衡赛道与车辆组合的数据分布，以及确保模拟环境与真实驾驶条件之间的有效映射。此外，数据标注的自动化处理与大规模仿真计算资源的调度亦构成了重要的技术障碍。

常用场景

经典使用场景

在自动驾驶与强化学习领域，AssettoCorsaGym数据集以其丰富的模拟驾驶轨迹数据，为算法验证与模型训练提供了理想平台。该数据集整合了人类驾驶员与SAC策略生成的驾驶行为，覆盖了从专业赛车手到初学者的多技能层次，使得研究者能够在高度可控的虚拟环境中，系统性地评估自动驾驶策略的鲁棒性与泛化能力。其经典使用场景集中于强化学习与模仿学习的交叉研究，通过对比人类驾驶数据与算法生成数据，深入探索智能体在复杂动态环境中的决策机制。

衍生相关工作

围绕AssettoCorsaGym数据集，已衍生出多项经典研究工作，主要集中在强化学习与自动驾驶的交叉领域。例如，基于该数据集的SAC策略生成方法被用于探索离线强化学习在驾驶任务中的有效性；同时，结合人类驾驶数据的行为克隆研究，推动了模仿学习在复杂动态环境中的新进展。此外，该数据集还促进了多智能体赛车协同控制、赛道适应性策略优化等方向的研究，为学术界提供了可复现的基准测试平台，进一步丰富了自动驾驶仿真研究的生态体系。

数据集最近研究