five

Zenseact Open Dataset (ZOD)|自动驾驶数据集|多模态数据集数据集

收藏
github2024-05-21 更新2024-05-31 收录
自动驾驶
多模态数据集
下载链接:
https://github.com/zenseact/zod
下载链接
链接失效反馈
资源简介:
Zenseact Open Dataset (ZOD) 是一个由Zenseact团队开发的大型多模态自动驾驶数据集,分为Frames、Sequences和Drives三个类别。该数据集用于支持自动驾驶相关的研究和开发,提供了丰富的数据用于训练和测试。

The Zenseact Open Dataset (ZOD) is a large-scale multimodal autonomous driving dataset developed by the Zenseact team, categorized into Frames, Sequences, and Drives. This dataset is designed to support research and development in autonomous driving, offering a wealth of data for training and testing purposes.
创建时间:
2022-12-12
原始信息汇总

Zenseact Open Dataset 概述

数据集介绍

  • 名称: Zenseact Open Dataset (ZOD)
  • 类型: 大型多模态自动驾驶数据集
  • 开发者: Zenseact 研究团队
  • 分类: 数据集分为三个类别:Frames, Sequences, 和 Drives

数据集使用示例

  • 提供了一系列Jupyter笔记本,展示如何使用数据集,包括如何使用Detectron2训练物体检测模型。

数据集安装

  • 最小依赖安装: pip install zod
  • 包含CLI的安装: pip install "zod[cli]"
  • 完整开发包安装: pip install "zod[all]"

数据集下载

  • 使用CLI下载数据集,支持交互式和命令行参数指定下载。
  • 支持下载不同版本和子集,如minifull版本。
  • 可选择下载特定的数据流,如通过--no-<stream>排除某些数据流。

数据集匿名化

  • 数据集通过brighterAI进行匿名化处理。
  • 提供两种匿名化模式:深度伪造(DNAT)和模糊处理。

数据集引用

  • 引用格式:

    @inproceedings{zod2023, author = {Alibeigi, Mina and Ljungbergh, William and Tonderski, Adam and Hess, Georg and Lilja, Adam and Lindstr{"o}m, Carl and Motorniuk, Daria and Fu, Junsheng and Widahl, Jenny and Petersson, Christoffer}, title = {Zenseact Open Dataset: A large-scale and diverse multimodal dataset for autonomous driving}, year = {2023}, booktitle={Proceedings of the IEEE/CVF International Conference on Computer Vision}, pages={20178--20188}, }

数据集版权与许可

  • 数据集: 版权所有者为Zenseact AB,根据CC BY-SA 4.0许可。
  • 开发包: 根据MIT许可。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Zenseact Open Dataset (ZOD) 由 Zenseact 的研究团队开发,是一个大规模的多模态自动驾驶数据集。该数据集被划分为三个类别:帧(Frames)、序列(Sequences)和驱动(Drives)。数据集的构建过程包括从实际自动驾驶环境中采集多模态数据,并通过先进的匿名化技术处理,以保护个人隐私。匿名化方法包括深度伪造(DNAT)和模糊处理,确保数据在保持高质量的同时,不泄露任何个人身份信息。
特点
ZOD 数据集的特点在于其多模态数据的丰富性和多样性,涵盖了图像、激光雷达扫描、车辆数据等多种信息源。此外,数据集的匿名化处理确保了隐私保护,同时不影响机器学习模型的性能。数据集的结构设计合理,便于研究人员和开发者进行不同层次的数据访问和分析,支持从单帧图像到长时间序列的多种研究需求。
使用方法
使用 ZOD 数据集,用户可以通过 pip 安装相应的库,并利用提供的 CLI 工具进行数据下载和管理。数据集的下载可以通过交互式命令行界面完成,支持多种下载选项,如选择特定子集、版本和数据流。此外,数据集还提供了详细的示例代码和 Jupyter Notebook,帮助用户快速上手,包括如何使用 Detectron2 进行对象检测模型的训练。
背景与挑战
背景概述
Zenseact Open Dataset (ZOD) 是由 Zenseact 公司的一组研究人员开发的大型多模态自动驾驶数据集。该数据集于2023年发布,旨在为自动驾驶领域的研究提供丰富的数据支持。ZOD 分为三个类别:*Frames*、*Sequences* 和 *Drives*,涵盖了自动驾驶研究中的多种数据类型。该数据集的发布不仅为研究人员提供了宝贵的资源,还推动了自动驾驶技术的进步,特别是在对象检测和场景理解方面。通过匿名化处理,ZOD 确保了数据的隐私保护,同时不影响模型的性能。
当前挑战
ZOD 数据集在构建过程中面临了多重挑战。首先,数据集的多样性和规模要求高效的存储和处理技术,以确保数据的完整性和可用性。其次,匿名化处理虽然保护了隐私,但也带来了技术上的挑战,如如何在不影响模型性能的前提下实现有效的匿名化。此外,数据集的多样性也意味着需要处理不同传感器数据之间的同步和融合问题。最后,数据集的公开使用需遵守严格的隐私和伦理规范,确保不侵犯个人隐私或用于军事目的。
常用场景
经典使用场景
Zenseact Open Dataset (ZOD) 在自动驾驶领域中被广泛应用于多模态数据处理与分析。其经典使用场景包括但不限于:利用数据集中的图像、激光雷达和车辆传感器数据,训练和验证物体检测、语义分割和行为预测模型。通过这些模型的训练,研究人员能够提升自动驾驶系统在复杂环境中的感知和决策能力,从而推动自动驾驶技术的进步。
解决学术问题
ZOD 数据集解决了自动驾驶领域中多模态数据融合与处理的学术难题。其丰富的数据类型和高质量的标注信息,为研究人员提供了宝贵的资源,用于探索和验证新的算法和模型。此外,数据集的匿名化处理方法也为隐私保护和数据伦理研究提供了新的视角,推动了相关领域的学术进展。
衍生相关工作
基于 ZOD 数据集,研究人员已开展了一系列相关工作,包括但不限于:多模态数据融合算法的研究、自动驾驶系统的鲁棒性分析、以及隐私保护技术的应用。这些工作不仅提升了自动驾驶技术的性能,还推动了相关领域的技术革新。例如,一些研究团队利用 ZOD 数据集开发了新的物体检测模型,显著提高了检测精度和实时性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

鸭绿江流域与水系 – 世界地理数据大百科辞条

鸭绿江流域是指鸭绿江干流和支流汇水区,地理位置为39&deg43′57″N-42&deg17′28″N,123&deg35′59″E-128&deg45′50″E。与其接壤的流域分别是辽河流域(东)、松花江流域(北)、图们江流域(北)、大同江流域(西南)等。鸭绿江流域界线在中国境内从长白山天池火山口的南壁起始,向西南经长白山脉、转向西南至千山山脉的北部,再折向南入海;在朝鲜境内,鸭绿江流域从长白山天池南坡启始向东南经过摩天岭山脉,在头流山(2309 m)转向西南方向的赴战岭山脉,在英雄里附近转向西,经狼林山(2184 m)、广城、松源,转向西南方向的狄逾岭山脉,接江南山脉的南部后至鸭绿江河口。鸭绿江流域面积65215.49 km&sup2,其中,中国境内面积32799.22 km&sup2,朝鲜境内面积32416.27 km&sup2。鸭绿江是中(国)朝(鲜)界河,它起源于长白山天池火山口的南壁,向南经惠山(朝)、折向西经临江(中)、再转向西南直向丹东(中)、新义州(朝),最后在东港(中)和多狮里(朝)附近注入黄海的西朝鲜湾。鸭绿江干流长844.98 km,有几条比较大的支流汇入,包括在朝鲜境内的虛川江、長津江、厚州川、慈城江、禿魯江、忠满江和三桥川;在中国境内的浑江、蒲石河、瑗河等。鸭绿江干流沿中朝国界线自东北向西南流经吉林省的长白朝鲜族自治县、临江市、集安市;辽宁省的桓仁满族自治县、宽甸满族自治县、丹东市和东港市;朝鲜的两江道、慈江道和平安北道。鸭绿江流域地处暖温带湿润季风气候区。年降水量800-1200 mm。流域内多山,最高海拔2745 m,河道比降比较大,达到0.0032,其中在中段可达到0.01。丰富的降水补给和较大的河床比降,使得鸭绿江流域成为亚洲单位面积水资源和水利资源最丰富的流域之一。近80年来,流域内先后建造了水丰水库(中、朝)、渭源水库(中、朝)、铁甲水库(中)、太平哨水库(中)、桓仁水库(中)、回龙山水库(中)、满丰湖水库(朝)、版平里水库(朝)、时中湖水库(朝)、狼林湖水库(朝)、长津湖水库(朝)、赴战湖水库(朝)、丰西湖水库等(朝)。数据文件包括鸭绿江干流、鸭绿江水系和鸭绿江流域地理信息系统数据文件组成。数据集以.kmz 和.shp格式存储,数据量43.8 MB(压缩为20.1 MB)。

国家对地观测科学数据中心 收录

BBGRE

The Brain & Body Genetic Resource Exchange (BBGRE) provides a resource for investigating the genetic basis of neurodisability. It combines phenotype information from patients with neurodevelopmental and behavioural problems with clinical genetic data, and displays this information on the human genome map.

国家生物信息中心 收录

全球1km分辨率大气二氧化碳浓度数据集(2003-2023)

持续增加的人为CO₂排放导致了全球变暖和气候变化,进而引发了全球范围的重大环境、经济和健康损失,基于卫星遥感数据准确连续地监测大气CO₂变化对于理解全球碳循环、评估碳源和碳汇的分布以及制定有效的减排政策至关重要。大气CO2柱浓度(XCO2)指从地表到大气顶层干燥空气柱中CO2的平均体积比,是用来表征大气中CO2分子含量的物理量。当前已公开发表的全球无缝XCO2产品存在无法同时提供长时间跨度和高时空分辨率的问题,限制了其更为广泛的科学应用。本数据集基于来自SCIAMACHY、GOSAT 和 OCO-2 三颗卫星/传感器的XCO2观测数据进行二次研发,以卫星XCO2观测数据为训练标签,与 CO₂ 排放、吸收和传输相关的多源因素为解释变量,利用整合了U-Net网络和ConvLSTM网络的深度学习算法构建预测模型,生成了国际首套2003-2023年全球时空连续1公里分辨率逐日XCO2数据集。经全球27个TCCON地面观测站点的验证,结果表明该产品具有较好的精度(决定系数R2为0.989,均方根误差RMSE为1.021ppm)。本数据集为深化对全球碳循环的理解、评估减排政策以及应对气候变化挑战提供了重要的基础数据。

国家青藏高原科学数据中心 收录

ERIC (Education Resources Information Center)

ERIC (Education Resources Information Center) 是一个广泛的教育文献数据库,包含超过130万条记录,涵盖从1966年至今的教育研究、政策和实践。数据集内容包括教育相关的期刊文章、书籍、研究报告、会议论文、技术报告、政策文件等。

eric.ed.gov 收录

Global Burden of Disease (GBD)

全球疾病负担数据库(Global Burden of Disease,GBD)是一个全球性的健康数据平台,旨在提供详尽的健康数据资源,涵盖调查、人口普查、生命统计等多方面信息,为全球健康研究提供重要支持。该数据库可通过其官方网站访问,为非商业用户免费提供数据下载、共享、修改及二次开发等服务,但需遵循 IHME 免费非商业用户协议,商业用途需咨询 IHME 条款和条件。GBD 2021 数据及所有 IHME 数据均在此平台提供,是健康数据研究者的重要资源。

ghdx.healthdata.org 收录