five

Zenseact Open Dataset (ZOD)|自动驾驶数据集|多模态数据集数据集

收藏
arXiv2023-10-21 更新2024-07-24 收录
自动驾驶
多模态数据集
下载链接:
https://zod.zenseact.com/
下载链接
链接失效反馈
资源简介:
Zenseact Open Dataset (ZOD) 是欧洲最大的多模态自动驾驶数据集,涵盖了从瑞典北部到意大利乡村的广泛地理区域。该数据集包含超过10万个精心策划的交通场景,覆盖了各种真实的驾驶情况、天气条件、道路类型和照明条件。ZOD 使用高分辨率传感器收集数据,并配有详细的2D/3D对象关键帧注释,支持长距离感知和多任务学习。此外,ZOD 是首个在允许研究与商业使用许可下发布的大型自动驾驶数据集,旨在促进技术创新并加速自动驾驶技术的发展。
提供机构:
Zenseact
创建时间:
2023-05-03
AI搜集汇总
数据集介绍
main_image_url
构建方式
Zenseact Open Dataset (ZOD) 的构建旨在填补现有自动驾驶数据集在多样性和远距离感知能力方面的不足。该数据集在欧洲多个国家进行了为期两年的数据收集,覆盖面积是现有数据集的九倍。ZOD 通过使用高分辨率传感器,如 8MP 摄像头和具有 254k 点每扫描的屋顶 LiDAR,以及高精度 GNSS/IMU 惯性导航系统,实现了详细的 2D 和 3D 对象标注(最远可达 245 米),道路实例/语义分割,交通标志识别和道路分类。数据集分为帧、序列和驱动,旨在涵盖数据多样性并支持时空学习、传感器融合、定位和地图绘制。
特点
ZOD 的特点在于其大规模、多样性和高分辨率传感器数据的结合。数据集包含了超过 100k 的交通场景,覆盖了广泛的实际驾驶情况,包括不同的天气、道路类型和光照条件。此外,ZOD 提供了详细的标注,包括语义和实例分割掩码、2D 和 3D 边界框、道路状况标签和丰富的交通标志分类。这些特点使得 ZOD 成为推动远距离感知和多任务学习的理想数据集。
使用方法
ZOD 数据集的使用方法多样,适用于各种自动驾驶相关的研究和应用。帧数据适合非时间感知任务,序列数据用于时空学习和预测,驱动数据则适用于长期任务如定位、地图绘制和规划。数据集还提供了全面的元数据,便于领域适应和迁移学习的研究。此外,ZOD 是首个在宽松许可证下发布的大规模自动驾驶数据集,允许研究与商业用途,并附带了详细的开发工具包,包括多个教程和示例,以促进快速上手和应用。
背景与挑战
背景概述
Zenseact Open Dataset (ZOD) 是由 Zenseact 公司开发的一个大规模、多样化的多模态自动驾驶数据集,旨在解决现有自动驾驶数据集在多样性和远距离感知能力方面的不足。该数据集由 Mina Alibeigi 等研究人员于 2023 年创建,涵盖了欧洲 14 个国家的多种交通场景,包括城市、乡村和高速公路等。ZOD 的特点在于其高分辨率传感器和详细的标注,包括 2D 和 3D 物体标注、道路实例/语义分割、交通标志识别和道路分类等,这些标注最远可达 245 米。ZOD 的发布旨在推动长距离感知和多任务学习的突破,并为自动驾驶领域的研究提供丰富的数据支持。
当前挑战
ZOD 数据集在构建过程中面临多项挑战。首先,数据集的多样性要求在不同国家、不同天气和光照条件下进行数据采集,这增加了数据收集和处理的复杂性。其次,高分辨率传感器和远距离标注的实现需要先进的传感器技术和精确的标注工具,以确保数据的准确性和可靠性。此外,数据集的隐私保护也是一个重要挑战,ZOD 采用了模糊和深度神经匿名化技术来保护个人隐私,同时确保这些匿名化技术不会影响机器学习模型的性能。最后,ZOD 的发布还面临如何确保数据集的广泛可用性和商业应用的兼容性,这需要制定合适的许可协议和提供详尽的开发工具包。
常用场景
经典使用场景
Zenseact Open Dataset (ZOD) 以其大规模和多样化的多模态数据集著称,特别适用于自动驾驶领域的长距离感知和多任务学习。该数据集包含了来自欧洲多个国家的超过10万帧的交通场景,涵盖了从城市道路到高速公路的广泛驾驶环境。ZOD 通过提供高分辨率的传感器数据和详细的标注,支持2D和3D对象检测、道路实例/语义分割、交通标志识别和道路分类等任务,极大地推动了自动驾驶技术的研究和发展。
实际应用
ZOD 在实际应用中具有广泛的前景,特别是在自动驾驶汽车的开发和测试阶段。数据集的高分辨率传感器数据和详细标注可以用于训练和验证自动驾驶系统中的感知、融合和规划算法。此外,ZOD 的开放许可允许商业和研究用途,为初创公司和商业实体提供了利用该数据集进行项目开发的机会,从而加速自动驾驶技术的商业化进程。
衍生相关工作
ZOD 的发布激发了大量相关研究工作,特别是在长距离感知和多任务学习领域。例如,基于 ZOD 数据集的研究已经推动了3D对象检测和跟踪、视觉里程计、场景流估计等技术的发展。此外,ZOD 的开放性和多样性也促进了域适应和迁移学习研究的进展,为自动驾驶技术的跨域应用提供了新的可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

UAV123

从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。

OpenDataLab 收录

koen430/relevant_selected_stock_news

该数据集包含通过GPT-3.5-turbo筛选出的新闻文章,旨在用于微调大型语言模型,以预测新闻发布后的股票价格变动。数据集包括多个特征,如股票代码、提示、文本、URL、结果、相关性、令牌计数等,并分为训练集、验证集和测试集。

hugging_face 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

China Groundgroundwater Monitoring Network

该数据集包含中国地下水监测网络的数据,涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标(如pH值、溶解氧、总硬度等)以及环境因素(如气温、降水量等)。

www.ngac.org.cn 收录