five

OpenDriveLab/LightwheelOcc|自动驾驶数据集|合成数据数据集

收藏
hugging_face2024-04-09 更新2024-06-11 收录
自动驾驶
合成数据
下载链接:
https://hf-mirror.com/datasets/OpenDriveLab/LightwheelOcc
下载链接
链接失效反馈
资源简介:
LightwheelOcc是由Lightwheel AI开发的自动驾驶合成数据集,包含40,000帧数据及其对应的地面真实标签。数据集涵盖了多种地形、天气条件、车辆类型、植被和道路标记,旨在推动计算机视觉、自动驾驶和合成数据领域的研究。数据集的特点包括多样化的数据分布、准确的3D占用和深度标签,以及模拟nuScenes数据集的真实传感器配置。

LightwheelOcc是由Lightwheel AI开发的自动驾驶合成数据集,包含40,000帧数据及其对应的地面真实标签。数据集涵盖了多种地形、天气条件、车辆类型、植被和道路标记,旨在推动计算机视觉、自动驾驶和合成数据领域的研究。数据集的特点包括多样化的数据分布、准确的3D占用和深度标签,以及模拟nuScenes数据集的真实传感器配置。
提供机构:
OpenDriveLab
原始信息汇总

LightwheelOcc 数据集概述

基本信息

  • 数据集名称: LightwheelOcc
  • 类型: 3D Occupancy Synthetic Dataset
  • 应用领域: 自动驾驶
  • 开发者: Lightwheel AI
  • 数据量: 包含40,000帧,总计240,000张图像
  • 数据划分: 训练集28,000帧,验证集6,000帧,测试集6,000帧
  • 传感器配置: 包含6个摄像头传感器数据
  • 标签类型: 3D Occupancy, Flow, Depth Map
  • 许可证: cc-by-nc-nd-4.0

数据特点

  • 多样性: 包含复杂交通流和多种交通条件及驾驶行为的模拟,涵盖常见场景及夜间、雨天等挑战性条件,以及道路上的小型罕见物体等边缘案例。
  • 准确性: 提供精确且密集的3D占用和深度标签。
  • 真实性: 传感器配置模拟nuScenes数据集,确保数据的真实性和通用性。

数据样本

  • 3D Occupancy: 展示物体在三维空间中的占用情况。
  • Depth Map: 显示场景中各点的深度信息。

联系方式

  • 联系人: Tianyu (李天羽)
  • 邮箱: litianyu@pjlab.org.cn
AI搜集汇总
数据集介绍
main_image_url
构建方式
LightwheelOcc数据集由Lightwheel AI开发,是一个公开的自动驾驶合成数据集。该数据集通过生成式AI和仿真技术,构建了40,000帧的3D占用数据,涵盖多种地形、天气模式、车辆类型、植被和道路标线。数据集的构建过程中,不仅模拟了常规驾驶场景,还特别引入了复杂交通流和极端情况,如夜间和雨天等挑战性场景,以确保数据的多样性和真实性。
特点
LightwheelOcc数据集的显著特点在于其多样化的数据分布和精确的3D占用标签。数据集不仅包含了常规的驾驶场景,还特别设计了诸如小物体和罕见物体等边缘案例,以及夜间和雨天等复杂条件,极大地丰富了数据的真实性和多样性。此外,数据集还提供了密集的3D占用和深度标签,以及模拟nuScenes数据集的真实传感器配置,为自动驾驶和计算机视觉研究提供了高质量的合成数据。
使用方法
使用LightwheelOcc数据集进行研究时,用户首先需要下载数据集,该数据集包含40,000帧图像,分为训练、验证和测试集。数据集提供了6个摄像头传感器的数据,以及3D占用、流和深度图等多种任务的标签。用户可以根据研究需求,选择合适的子集进行训练和验证。此外,数据集的详细使用说明和相关资源可以在其官方页面找到,确保用户能够充分利用该数据集进行自动驾驶和计算机视觉的研究。
背景与挑战
背景概述
LightwheelOcc数据集由Lightwheel AI开发,是一个公开的自动驾驶合成数据集,旨在推动计算机视觉、自动驾驶和合成数据领域的研究。该数据集包含40,000帧图像及其对应的地面真实标签,涵盖多种任务,如3D占用、流和深度图。Lightwheel AI利用生成式AI和仿真技术,生成物理上逼真且具有普遍适用性的3D合成数据,以应对自动驾驶和具身AI的挑战。通过发布LightwheelOcc,研究者们能够在多样化的地形、天气模式、车辆类型和道路标志等复杂场景中进行深入研究,从而推动自动驾驶技术的进步。
当前挑战
LightwheelOcc数据集在构建过程中面临多项挑战。首先,数据集需要模拟复杂的交通流和多样化的驾驶行为,包括夜间和雨天等极端条件,以及罕见的小物体等边缘案例,以确保数据的广泛适用性和真实性。其次,生成高精度和密集的3D占用和深度标签,以及模拟真实的传感器配置,如nuScenes数据集,这些都对数据质量和仿真精度提出了高要求。此外,如何在合成数据中保持物理真实性和普遍适用性,同时确保数据集的多样性和复杂性,也是该数据集面临的重要挑战。
常用场景
经典使用场景
LightwheelOcc数据集在自动驾驶领域中,以其丰富的3D占用信息和深度标签,成为研究计算机视觉和自动驾驶算法的重要资源。该数据集通过模拟多种地形、天气模式和交通状况,提供了包括夜间、雨天等复杂场景在内的多样化数据分布。研究者可以利用这些数据进行3D占用预测、深度估计等任务的模型训练和验证,从而提升自动驾驶系统在各种环境下的鲁棒性和准确性。
衍生相关工作
基于LightwheelOcc数据集,研究者们开发了多项相关工作,如DriveAGI和OccNet等项目。这些工作利用数据集中的3D占用和深度信息,进一步探索了自动驾驶中的感知和决策问题。DriveAGI项目专注于自动驾驶的智能决策,而OccNet则致力于开发高效的3D占用网络,这些衍生工作不仅丰富了自动驾驶领域的研究内容,也为实际应用提供了技术支持。
数据集最近研究
最新研究方向
在自动驾驶领域,LightwheelOcc数据集凭借其丰富的合成数据和多样的场景分布,成为推动计算机视觉与自动驾驶技术研究的前沿工具。该数据集不仅涵盖了常规驾驶场景,还特别关注了诸如夜间、雨天等极端条件以及罕见物体等边缘案例,为算法在复杂环境下的鲁棒性提供了宝贵的测试平台。此外,LightwheelOcc通过精确的3D占用和深度标签,模拟了真实的传感器配置,进一步提升了数据集在实际应用中的价值。这些特性使得LightwheelOcc在自动驾驶算法优化、场景理解及合成数据生成等研究方向上具有重要的推动作用,尤其在提升自动驾驶系统的安全性和可靠性方面展现了巨大的潜力。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

China Air Quality Historical Data

该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。

www.cnemc.cn 收录

TaRF

TaRF 是由密歇根大学、耶鲁大学和加州大学伯克利分校联合创建的视触融合场景数据集,旨在将视觉与触觉信号对齐至共享的三维空间。该数据集包含 19.3k 对齐的视觉与触觉样本,覆盖 13 个普通场景,如办公室、走廊和户外环境。数据采集通过结合神经辐射场(NeRF)和触觉传感器完成,利用多视图几何方法校准视觉与触觉信号,实现空间对齐。TaRF 的创建过程包括场景的多视角视觉重建和同步采集触觉信号,最终通过扩散模型生成未直接采样的触觉信号。该数据集可用于触觉信号估计、触觉定位和材料属性理解等任务,为机器人交互和虚拟世界构建提供重要支持。

github 收录

The MaizeGDB

The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。

www.maizegdb.org 收录

Chinese-web-novel

本数据集从https://m.bqgui.cc爬取了每本书至多25章的内容,共12740项数据。数据经过三轮清洗,包含书名、简介和小说文本三部分信息。书名质量较好,简介可用性较低,小说文本已过滤部分广告和符号,但仍有改进空间。

huggingface 收录