five

sensodat

收藏
Hugging Face2026-03-05 更新2026-03-06 收录
下载链接:
https://huggingface.co/datasets/it4lia/sensodat
下载链接
链接失效反馈
官方服务:
资源简介:
SensoDat是一个自动驾驶汽车仿真数据集,包含14个测试活动中执行的32,580次仿真。该数据集通过先进的测试生成器(Frenetic、Frenetic-V和AmbieGen)在BeamNG仿真环境中生成。数据集内容包括ASAM OpenDRIVE格式的仿真描述数据、每次执行的轨迹日志、81个模拟传感器/属性的时间序列数据、执行元数据(配置、持续时间、有效性和预测结果)以及基于OOB(越界)安全指标的PASS/FAIL结果。记录的传感器数据流涵盖车辆动力学和控制信号,如RPM、车轮速度、油门和刹车输入、刹车温度、转向信号、变速器状态、ABS/ESC活动等。数据集总大小为3.34 GB,存储在MongoDB中以支持高效查询和大规模分析。SensoDat支持的研究领域包括自动驾驶系统的AI和机器学习、回归测试和测试优先级排序、仿真波动性分析、安全验证和故障检测以及基于仿真的SDC测试的可重复性和基准测试。
创建时间:
2026-02-28
原始信息汇总

SensoDat数据集概述

数据集基本信息

  • 数据集名称:SensoDat: Simulation-based Sensor Dataset of Self-driving Cars
  • 数据集描述:一个自动驾驶汽车仿真数据集,包含使用先进测试生成器(Frenetic, Frenetic-V, AmbieGen)在BeamNG仿真环境中生成的仿真数据。

数据集规模与内容

  • 仿真执行总数:32,580次,涵盖14个测试活动。
  • 数据总量:3.34 GB的结构化数据。
  • 存储方式:存储在MongoDB中,以支持高效查询和大规模分析。
  • 数据内容
    • 采用ASAM OpenDRIVE格式的仿真描述数据。
    • 每次执行的轨迹日志。
    • 81个模拟传感器/属性的时间序列传感器数据。
    • 执行元数据(配置、持续时间、有效性、预测结果)。
    • 基于OOB(Out-of-Bounds)安全指标的PASS/FAIL结果。
  • 传感器数据详情:记录的传感器流包括车辆动力学和控制信号,如RPM、车轮速度、油门和刹车输入、刹车温度、转向信号、变速箱状态、ABS/ESC活动等。

研究应用领域

  • 自主系统的人工智能和机器学习。
  • 回归测试和测试优先级排序。
  • 仿真不稳定性分析。
  • 安全验证和故障检测。
  • 基于仿真的自动驾驶汽车测试中的可重复性和基准测试。

参考资源

  • Jupyter Notebook分析代码:https://huggingface.co/datasets/it4lia/sensodat/blob/main/analysis.ipynb
  • 最新发布版本(Zenodo):https://doi.org/10.5281/zenodo.12600225
  • 原始论文构件(Zenodo):https://doi.org/10.5281/zenodo.10307479
  • 原始论文:https://dl.acm.org/doi/10.1145/3643991.3644891
  • 预印本:https://doi.org/10.48550/arXiv.2401.09808

相关论文引用

bibtex @inproceedings{sensodat, author = {Christian Birchler and Cyrill Rohrbach and Timo Kehrer and Sebastiano Panichella}, title = {SensoDat: Simulation-based Sensor Dataset of Self-driving Cars}, booktitle = {21th {IEEE/ACM} International Conference on Mining Software Repositories, {MSR} 2024, Lisbon, Portugal, April 15-16, 2024}, year = {2024}, doi = {to appear}, }

@article{sensodat-preprint, author = {Christian Birchler and Cyrill Rohrbach and Timo Kehrer and Sebastiano Panichella}, title = {SensoDat: Simulation-based Sensor Dataset of Self-driving Cars}, journal = {CoRR}, volume = {abs/2401.09808}, year = {2024}, url = {https://doi.org/10.48550/arXiv.2401.09808}, doi = {10.48550/ARXIV.2401.09808}, eprinttype = {arXiv}, eprint = {2401.09808}, }

许可信息

  • 许可证:GNU General Public License v3.0 或更高版本。
  • 版权声明:Copyright (C) 2024 Christian Birchler & Sebastiano Panichella (AI4I - The Italian Institute of Artificial Intelligence for Industry)。
搜集汇总
数据集介绍
构建方式
在自动驾驶仿真测试领域,SensoDat数据集通过前沿的测试生成工具Frenetic、Frenetic-V与AmbieGen,在BeamNG高保真软体物理仿真环境中系统构建而成。该数据集涵盖了14个测试活动中执行的32,580次仿真,每项测试均以ASAM OpenDRIVE格式记录仿真描述,并同步采集轨迹日志与81种传感器属性的时序数据。执行过程的元数据,包括配置参数、持续时间、有效性及预测结果,均被完整保存,同时依据越界安全度量标准标注了通过或失败标签,从而形成了一套结构严谨、覆盖全面的仿真实验记录。
特点
SensoDat的显著特征在于其规模宏大且内容精细,总计3.34 GB的结构化数据存储于MongoDB数据库中,支持高效查询与大规模分析。数据集不仅囊括了车辆动力学与控制信号,如发动机转速、车轮速度、油门与制动输入、制动温度、转向信号及变速器状态等多元传感器流,还涵盖了防抱死制动系统与电子稳定控制活动等高级车辆系统信息。这种高保真度的仿真数据为研究人员提供了无需重复执行昂贵仿真实验即可深入探究自动驾驶系统动态行为的宝贵资源。
使用方法
为便于学术研究与应用开发,SensoDat提供了基于Docker的自动化部署方案。用户仅需运行附带的setup脚本即可启动包含MongoDB数据库的容器化环境,自动完成数据导入与索引构建。数据集支持在人工智能与机器学习、回归测试与测试优先级排序、仿真波动性分析、安全验证与故障检测等多个研究方向上直接应用。完成使用后,可通过cleanup脚本便捷地清理数据库环境,确保研究过程的可重复性与资源管理的灵活性。
背景与挑战
背景概述
自动驾驶技术的验证与测试是确保其安全性与可靠性的核心环节,SensoDat数据集于2024年由Christian Birchler、Cyrill Rohrbach、Timo Kehrer及Sebastiano Panichella等研究人员共同构建,隶属于AI4I意大利工业人工智能研究所。该数据集旨在通过高保真仿真环境,系统性地收集自动驾驶车辆在多样化测试场景中的传感器数据,以支持人工智能与机器学习在自主系统中的研究。其核心研究问题聚焦于如何利用仿真生成的传感器时间序列数据,推动自动驾驶系统的回归测试、安全验证及故障检测等领域的发展,为仿真驱动的软件测试提供了可复现的基准资源。
当前挑战
在自动驾驶领域,如何高效、经济地获取大规模、高质量的传感器数据以验证系统安全性与鲁棒性,是长期存在的关键挑战。SensoDat数据集致力于应对这一挑战,通过仿真生成涵盖81种传感器属性的时间序列数据,模拟真实车辆动态,从而避免了实际路测的高成本与高风险。然而,在构建过程中,研究人员面临仿真环境与真实世界之间的域差距问题,需确保物理仿真的高保真度以准确反映车辆行为;同时,处理32,580次仿真执行产生的3.34GB结构化数据,涉及高效存储、查询与管理,采用MongoDB数据库以实现大规模分析,这也对数据集成与可访问性提出了技术要求。
常用场景
经典使用场景
在自动驾驶系统验证领域,SensoDat数据集为研究人员提供了高保真仿真环境下的丰富传感器数据流。该数据集通过整合32,580次仿真执行记录,涵盖81种车辆动态传感器信号,典型应用于机器学习模型的训练与评估。研究者可基于其时间序列数据构建预测模型,分析车辆在复杂场景下的行为模式,从而优化自动驾驶算法的决策逻辑与安全性能。
衍生相关工作
基于SensoDat数据集,学术界已衍生出多项关于测试生成与安全验证的创新研究。例如,结合Frenetic等测试生成工具的工作进一步探索了边缘场景的自动化构建方法;另有研究利用该数据集的传感器时序特征,开发了针对仿真结果波动性的检测模型。这些成果共同推动了基于仿真的自动驾驶测试方法论向更高效、可复现的方向演进。
数据集最近研究
最新研究方向
在自动驾驶仿真测试领域,高保真传感器数据的稀缺性长期制约着算法验证的深度与广度。SensoDat数据集凭借其大规模、高维度的仿真传感器时序数据,为相关研究开辟了新的路径。当前前沿探索聚焦于利用该数据集训练端到端的深度神经网络模型,旨在直接从丰富的传感器流中学习复杂的驾驶场景表征与决策策略,从而降低对人工设计特征的依赖。与此同时,该数据集正被用于研究仿真测试的脆弱性分析与测试用例优先级排序,通过挖掘传感器数据模式与测试失败结果之间的隐含关联,以构建更高效、可靠的自动化测试框架。这些研究方向紧密关联着行业对提升自动驾驶系统安全性与验证效率的迫切需求,推动了仿真技术在研发流程中的核心地位从辅助工具向可信验证环境的演进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作