five

Waymo Open Dataset|自动驾驶数据集|机器感知数据集

收藏
github2019-11-28 更新2024-05-31 收录
自动驾驶
机器感知
下载链接:
https://github.com/rmundra22/waymo-open-dataset
下载链接
链接失效反馈
资源简介:
Waymo开放数据集由Waymo自动驾驶汽车在各种条件下收集的高分辨率传感器数据组成。我们公开发布这个数据集,以帮助研究社区在机器感知和自动驾驶技术方面取得进步。

Waymo公开数据集由Waymo自动驾驶车辆在多种环境下所采集的高分辨率传感器数据构成。本数据集之公开发布旨在助力研究界在机器感知与自动驾驶技术领域取得显著进展。
创建时间:
2019-09-17
原始信息汇总

数据集概述

数据集名称

  • 主名称:Waymo Open Dataset: An autonomous driving dataset
  • 别名:Waymo Open Dataset

数据集描述

  • 描述:The Waymo Open Dataset 包含由Waymo自动驾驶汽车在多种条件下收集的高分辨率传感器数据。该数据集的公开发布旨在帮助研究社区在机器感知和自动驾驶技术方面取得进展。

数据集URL

  • 主URL:https://github.com/waymo-research/waymo-open-dataset
  • 相关链接:https://www.waymo.com/open

数据集提供者

  • 名称:Waymo
  • 相关链接:https://en.wikipedia.org/wiki/Waymo

数据集许可

  • 许可名称:Waymo Dataset License Agreement for Non-Commercial Use (August 2019)
  • 许可详情链接:https://waymo.com/open/terms/
AI搜集汇总
数据集介绍
main_image_url
构建方式
Waymo Open Dataset的构建基于Waymo自动驾驶车辆在多种复杂环境下的高分辨率传感器数据采集。该数据集的形成过程涉及对自动驾驶车辆所配备的各类传感器进行数据记录,包括但不限于激光雷达、摄像头和雷达等,以确保数据的全面性和多样性。这些数据经过严格的校准和处理,以保证其在不同环境条件下的准确性和一致性,从而为机器感知和自动驾驶技术的研究提供坚实的基础。
使用方法
使用Waymo Open Dataset时,研究者可以通过访问其官方网站获取数据,并利用提供的TensorFlow辅助函数进行模型构建。数据集的格式定义和评估指标均在代码库中详细说明,便于用户快速上手。此外,数据集的使用需遵守其非商业用途的许可协议,确保数据的合法使用。通过这些资源,研究者可以深入探索机器感知和自动驾驶技术的前沿问题。
背景与挑战
背景概述
Waymo Open Dataset,由Waymo公司于2019年发布,旨在为机器感知和自动驾驶技术研究提供高质量的传感器数据。该数据集汇集了Waymo自动驾驶汽车在多种复杂环境下的高分辨率传感器数据,极大地推动了自动驾驶领域的研究进展。Waymo作为自动驾驶技术的领军企业,其开放数据集的发布不仅为学术界和工业界提供了宝贵的资源,也为全球自动驾驶技术的创新和应用奠定了坚实的基础。
当前挑战
Waymo Open Dataset在构建过程中面临了多重挑战。首先,数据采集需在各种复杂和多变的道路条件下进行,确保数据的全面性和代表性。其次,数据的高分辨率和高精度要求对存储和处理技术提出了严峻考验。此外,数据集的开放性也带来了数据隐私和安全性的问题,如何在保障数据安全的前提下促进研究应用,是该数据集面临的重要挑战。
常用场景
经典使用场景
在自动驾驶技术的研究领域,Waymo Open Dataset 以其高分辨率的传感器数据和多样化的环境条件,成为模型训练和算法验证的经典数据集。研究者们利用该数据集进行物体检测、路径规划和环境感知等任务,以提升自动驾驶系统的鲁棒性和准确性。
解决学术问题
Waymo Open Dataset 通过提供丰富的真实世界驾驶数据,解决了自动驾驶领域中数据稀缺和多样性不足的问题。这不仅推动了机器感知技术的进步,还为自驾驶系统的安全性评估提供了可靠依据,对学术研究和实际应用均具有深远影响。
实际应用
在实际应用中,Waymo Open Dataset 被广泛用于开发和测试自动驾驶系统,包括但不限于车辆导航、障碍物识别和交通规则遵守。通过模拟和验证不同驾驶场景,该数据集帮助企业优化自动驾驶技术,提升其在复杂环境中的表现。
数据集最近研究
最新研究方向
在自动驾驶技术的蓬勃发展背景下,Waymo Open Dataset作为高分辨率传感器数据的集合,已成为该领域研究的前沿资源。最新研究方向主要集中在利用该数据集提升机器感知算法的精度和鲁棒性,特别是在复杂和多变的道路环境中。此外,该数据集还被广泛应用于自动驾驶系统的仿真和测试,以验证和优化车辆在各种实际驾驶场景中的表现。这些研究不仅推动了自动驾驶技术的实际应用,也为相关领域的学术研究提供了宝贵的数据支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

Med-MAT

Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。

huggingface 收录

WLASL, MSASL, NMFs-CSL, SLR500, Slovo, BOBSL, 27 Class Sign Language Dataset, AUTSL, BosphorusSign22k, GSL, LSA16, LSA64, Rendered Handpose Dataset, YouTube-ASL, LSFB-ISOL, ASLLVD, AASL, KArSL, BdSLImset, HaGRID, Phoenix-2014, Phoenix-2014T

该仓库收集了多种与手语识别和翻译相关的数据集,旨在为研究者、开发者和爱好者提供一个集中的资源。数据集包括不同类型(如RGB、深度、骨骼)和来自不同国家的数据,用于支持手语识别和翻译技术的研究。

github 收录

SuMeyYao/ysmpubmedclt

该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。

hugging_face 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录