five

Zenseact Open Dataset (ZOD)|自动驾驶数据集|多模态数据集数据集

收藏
github2024-05-21 更新2024-05-31 收录
自动驾驶
多模态数据集
下载链接:
https://github.com/zenseact/zod
下载链接
链接失效反馈
资源简介:
Zenseact Open Dataset (ZOD) 是一个由Zenseact团队开发的大型多模态自动驾驶数据集,分为Frames、Sequences和Drives三个类别。该数据集用于支持自动驾驶相关的研究和开发,提供了丰富的数据用于训练和测试。

The Zenseact Open Dataset (ZOD) is a large-scale multimodal autonomous driving dataset developed by the Zenseact team, categorized into Frames, Sequences, and Drives. This dataset is designed to support research and development in autonomous driving, offering a wealth of data for training and testing purposes.
创建时间:
2022-12-12
原始信息汇总

Zenseact Open Dataset 概述

数据集介绍

  • 名称: Zenseact Open Dataset (ZOD)
  • 类型: 大型多模态自动驾驶数据集
  • 开发者: Zenseact 研究团队
  • 分类: 数据集分为三个类别:Frames, Sequences, 和 Drives

数据集使用示例

  • 提供了一系列Jupyter笔记本,展示如何使用数据集,包括如何使用Detectron2训练物体检测模型。

数据集安装

  • 最小依赖安装: pip install zod
  • 包含CLI的安装: pip install "zod[cli]"
  • 完整开发包安装: pip install "zod[all]"

数据集下载

  • 使用CLI下载数据集,支持交互式和命令行参数指定下载。
  • 支持下载不同版本和子集,如minifull版本。
  • 可选择下载特定的数据流,如通过--no-<stream>排除某些数据流。

数据集匿名化

  • 数据集通过brighterAI进行匿名化处理。
  • 提供两种匿名化模式:深度伪造(DNAT)和模糊处理。

数据集引用

  • 引用格式:

    @inproceedings{zod2023, author = {Alibeigi, Mina and Ljungbergh, William and Tonderski, Adam and Hess, Georg and Lilja, Adam and Lindstr{"o}m, Carl and Motorniuk, Daria and Fu, Junsheng and Widahl, Jenny and Petersson, Christoffer}, title = {Zenseact Open Dataset: A large-scale and diverse multimodal dataset for autonomous driving}, year = {2023}, booktitle={Proceedings of the IEEE/CVF International Conference on Computer Vision}, pages={20178--20188}, }

数据集版权与许可

  • 数据集: 版权所有者为Zenseact AB,根据CC BY-SA 4.0许可。
  • 开发包: 根据MIT许可。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Zenseact Open Dataset (ZOD) 由 Zenseact 的研究团队开发,是一个大规模的多模态自动驾驶数据集。该数据集被划分为三个类别:帧(Frames)、序列(Sequences)和驱动(Drives)。数据集的构建过程包括从实际自动驾驶环境中采集多模态数据,并通过先进的匿名化技术处理,以保护个人隐私。匿名化方法包括深度伪造(DNAT)和模糊处理,确保数据在保持高质量的同时,不泄露任何个人身份信息。
特点
ZOD 数据集的特点在于其多模态数据的丰富性和多样性,涵盖了图像、激光雷达扫描、车辆数据等多种信息源。此外,数据集的匿名化处理确保了隐私保护,同时不影响机器学习模型的性能。数据集的结构设计合理,便于研究人员和开发者进行不同层次的数据访问和分析,支持从单帧图像到长时间序列的多种研究需求。
使用方法
使用 ZOD 数据集,用户可以通过 pip 安装相应的库,并利用提供的 CLI 工具进行数据下载和管理。数据集的下载可以通过交互式命令行界面完成,支持多种下载选项,如选择特定子集、版本和数据流。此外,数据集还提供了详细的示例代码和 Jupyter Notebook,帮助用户快速上手,包括如何使用 Detectron2 进行对象检测模型的训练。
背景与挑战
背景概述
Zenseact Open Dataset (ZOD) 是由 Zenseact 公司的一组研究人员开发的大型多模态自动驾驶数据集。该数据集于2023年发布,旨在为自动驾驶领域的研究提供丰富的数据支持。ZOD 分为三个类别:*Frames*、*Sequences* 和 *Drives*,涵盖了自动驾驶研究中的多种数据类型。该数据集的发布不仅为研究人员提供了宝贵的资源,还推动了自动驾驶技术的进步,特别是在对象检测和场景理解方面。通过匿名化处理,ZOD 确保了数据的隐私保护,同时不影响模型的性能。
当前挑战
ZOD 数据集在构建过程中面临了多重挑战。首先,数据集的多样性和规模要求高效的存储和处理技术,以确保数据的完整性和可用性。其次,匿名化处理虽然保护了隐私,但也带来了技术上的挑战,如如何在不影响模型性能的前提下实现有效的匿名化。此外,数据集的多样性也意味着需要处理不同传感器数据之间的同步和融合问题。最后,数据集的公开使用需遵守严格的隐私和伦理规范,确保不侵犯个人隐私或用于军事目的。
常用场景
经典使用场景
Zenseact Open Dataset (ZOD) 在自动驾驶领域中被广泛应用于多模态数据处理与分析。其经典使用场景包括但不限于:利用数据集中的图像、激光雷达和车辆传感器数据,训练和验证物体检测、语义分割和行为预测模型。通过这些模型的训练,研究人员能够提升自动驾驶系统在复杂环境中的感知和决策能力,从而推动自动驾驶技术的进步。
解决学术问题
ZOD 数据集解决了自动驾驶领域中多模态数据融合与处理的学术难题。其丰富的数据类型和高质量的标注信息,为研究人员提供了宝贵的资源,用于探索和验证新的算法和模型。此外,数据集的匿名化处理方法也为隐私保护和数据伦理研究提供了新的视角,推动了相关领域的学术进展。
衍生相关工作
基于 ZOD 数据集,研究人员已开展了一系列相关工作,包括但不限于:多模态数据融合算法的研究、自动驾驶系统的鲁棒性分析、以及隐私保护技术的应用。这些工作不仅提升了自动驾驶技术的性能,还推动了相关领域的技术革新。例如,一些研究团队利用 ZOD 数据集开发了新的物体检测模型,显著提高了检测精度和实时性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国劳动力动态调查

“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。

中国学术调查数据资料库 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

yolo-datasets

深度学习目标检测数据集/分割数据集最全最完整的数据集集合,包含电力电气领域、航空影像输电线路与输电塔分割、电力遥感风力发电机、安全带和安全绳检测、变压器漏油故障诊断、高压输电线故障检测、光伏热红外缺陷、风电光伏功率数据、变电站火灾、输电线路语义分割、配网缺陷检测、变电站设备目标检测、太阳能光伏电池板缺陷、pcb电路板检测、绝缘体检测、输电线路防震锤缺陷、电线冰雪覆盖、电力工程电网施工现场安全作业、螺丝识别检测、变电站电力设备的可见光和红外图像、无人机航拍输电线路悬垂线夹、电线线路表面损害、氧化锌避雷器破损识别、热斑光伏发电系统红外热图像等多个领域的数据集。

github 收录

PulseBat Dataset

PulseBat数据集是由清华大学深圳国际研究生院与厦门立景新能源科技有限公司合作创建的,包含464个退役锂电池的多维度脉冲测试数据。该数据集覆盖了3种正极材料类型、6种使用历史、3种物理形态和6种容量设计。通过10种脉冲宽度和幅值,以及多个荷电状态和健康状况条件下进行脉冲测试,记录了测试条件和电压响应以及温度信号。该数据集可应用于电池的健康状态评估、荷电状态估计、正极材料类型识别、开路电压重构、热管理等关键诊断任务。

arXiv 收录