GTA-3D Dataset
收藏github2024-05-08 更新2024-05-31 收录
下载链接:
https://github.com/oscarmcnulty/gta-3d-dataset
下载链接
链接失效反馈官方服务:
资源简介:
一个包含2D图像、3D点云数据和3D车辆边界框标签的数据集,所有数据均通过Grand Theft Auto 5游戏引擎生成。数据集包含分辨率为1680x1050的图像和深度图数据,以及所有车辆的定向3D边界框标签。总大小为55GB。
A dataset comprising 2D images, 3D point cloud data, and 3D vehicle bounding box labels, all generated using the Grand Theft Auto 5 game engine. The dataset includes images and depth maps with a resolution of 1680x1050, along with oriented 3D bounding box labels for all vehicles. The total size of the dataset is 55GB.
创建时间:
2017-10-30
原始信息汇总
GTA-3D Dataset 概述
数据集内容
- 包含2D图像、3D点云数据和3D车辆边界框标签。
- 图像和深度图数据分辨率为1680x1050。
- 包含所有车辆的定向3D边界框标签。
数据集大小
- 总大小为55GB。
数据集使用
- 提供
gta.py中的辅助类来消费数据。 - 示例代码展示了如何加载RGB图像和获取车辆边界框信息。
数据集获取
- 数据集被分割成多个文件,每个zip文件包含完整的数据集段,包括特征和标签。
- 可通过以下链接下载各个zip文件:
- 67b90283-627b-45cf-9ff2-63dcb95bfc67.zip
- 7007b0bf-503c-4eb7-9b58-19e123ef40e0.zip
- 782579db-da70-492e-a119-4e5bf1241698.zip
- 9bac3205-32d1-4e24-8bc3-7591dbbfac34.zip
- bcac5255-a6aa-402b-9b75-4d9c422b8ae8.zip
- e121fb4d-2b4f-40e5-9a34-2658e7647afd.zip
- e14e4ede-d064-46ae-b513-bab61ca3259f.zip
- ebecc37a-77ea-46a2-bd54-f67740a411a9.zip
- ee16f4b5-07f1-4d96-a5b0-92b7de2eee17.zip
- fd10222e-d26b-4c47-8118-98c8ea545bb4.zip
- fdf4ad8d-d9b8-49a7-b9a6-c597b8876e0f.zip
搜集汇总
数据集介绍

构建方式
GTA-3D数据集通过利用《侠盗猎车手5》游戏引擎生成,涵盖了2D图像、3D点云数据以及3D车辆边界框标签。该数据集以1680x1050分辨率捕捉图像和深度图,并包含所有车辆的定向3D边界框标签。数据集总大小为55GB,分为多个压缩文件,每个文件均包含特征和标签的独立数据段。
特点
GTA-3D数据集的显著特点在于其结合了高分辨率的2D图像与3D点云数据,以及精确的3D车辆边界框标签。这种多模态数据的结合为3D物体定位和识别提供了丰富的信息源。此外,数据集的生成基于虚拟游戏环境,确保了数据的真实性和多样性,适用于多种计算机视觉任务的研究与应用。
使用方法
使用GTA-3D数据集时,可通过提供的`gta.py`文件中的辅助类来消费数据。例如,使用`GTAData`类可以加载单个样本的RGB图像,并获取场景中车辆数量及其在图像平面和鸟瞰图中的边界框坐标。数据集的下载链接提供了多个压缩文件,用户需分别下载并解压以获取完整数据。
背景与挑战
背景概述
GTA-3D数据集是由Grand Theft Auto 5游戏引擎生成的2D图像、3D点云数据以及3D车辆边界框标签的综合数据集。该数据集由一位本科生在其毕业论文《3D Object Localisation with Convolutional Neural Networks》中创建,旨在推动基于卷积神经网络的3D物体定位研究。数据集包含1680x1050分辨率的图像和深度图数据,以及所有车辆的3D边界框标签,总大小为55GB。该数据集的创建不仅为计算机视觉领域提供了丰富的合成数据资源,还为自动驾驶、机器人视觉等应用场景提供了重要的实验平台。
当前挑战
GTA-3D数据集在构建过程中面临多项挑战。首先,生成高质量的3D点云数据和精确的3D边界框标签需要复杂的图像处理和几何计算技术。其次,数据集的规模庞大,管理和存储55GB的数据对计算资源和存储系统提出了较高要求。此外,如何确保合成数据与真实世界数据的相似性,以便训练的模型能够有效迁移到实际应用中,也是一个重要的挑战。最后,数据集的使用需要高效的工具和接口,以便研究人员能够快速加载和处理数据,这也是该数据集在实际应用中需要解决的问题。
常用场景
经典使用场景
GTA-3D数据集在计算机视觉领域中被广泛应用于三维物体定位与识别任务。其经典使用场景包括利用卷积神经网络(CNN)对2D图像和3D点云数据进行联合分析,以实现对场景中车辆的精确三维定位。通过结合高分辨率图像和深度信息,研究者能够训练模型以识别并标注车辆的三维边界框,从而在自动驾驶、机器人导航等领域中发挥重要作用。
解决学术问题
该数据集解决了在复杂场景下三维物体定位的学术难题,尤其是在缺乏大规模真实世界3D标注数据的情况下。通过利用游戏引擎生成的高质量合成数据,研究者能够有效训练和验证三维物体检测算法,推动了计算机视觉领域中三维感知技术的发展。其意义在于为学术界提供了一个可控且丰富的数据源,促进了相关算法的创新与优化。
衍生相关工作
基于GTA-3D数据集,研究者们开展了多项相关工作,包括改进的三维物体检测算法、多模态数据融合技术以及深度学习模型的优化。这些工作不仅提升了三维物体定位的精度,还推动了合成数据在计算机视觉中的应用研究。此外,该数据集还激发了其他合成数据集的创建,为学术界和工业界提供了更多可用的资源,进一步推动了三维感知技术的发展。
以上内容由遇见数据集搜集并总结生成



