VKITTI3D Dataset

github2019-12-22 更新2024-05-31 收录

下载链接：

https://github.com/WuzhaoLee/vkitti3D-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

VKITTI3D数据集是一个户外数据集，用于评估点云的3D语义分割。该数据集直接源自Virtual KITTI数据集，提供了numpy格式的文件，每个文件包含场景中点的数量和每个点的特征数，特征包括XYZRGBL，即3D位置、RGB颜色和语义标签。

The VKITTI3D dataset is an outdoor dataset designed for evaluating 3D semantic segmentation of point clouds. Derived directly from the Virtual KITTI dataset, it provides files in numpy format, each containing the number of points in the scene and the number of features per point. The features include XYZRGBL, which stands for 3D position, RGB color, and semantic labels.

创建时间：

2018-12-01

原始信息汇总

数据集概述

名称: Virtual KITTI 3D Dataset for Semantic Segmentation
用途: 用于评估户外场景中的3D点云语义分割。
来源: 直接衍生自Virtual KITTI Dataset (v.1.3.1)。
版本: 数据集有两个版本，v1和v2。v1用于Engelmann et al. ICCVW17论文。

数据集下载

v1: VKITTI3D Dataset v1
v2: VKITTI3D Dataset v2 (即将发布)

数据生成

步骤:
1. 从Virtual KITTI Website下载并提取原始数据。
2. 使用create_npy.py脚本将原始数据转换为numpy格式。
3. 使用create_sets.py脚本创建数据集分割。

数据格式

文件类型: numpy .npy 文件。
数据结构: 每个文件包含一个 N x F 矩阵，其中 N 是场景中的点数，F 是每个点的特征数（F=7）。
特征: XYZRGBL，包括3D位置XYZ，颜色RGB和语义标签L。

标签信息

Label ID	Semantics	RGB	Color
0	Terrain	[200, 90, 0]	brown
1	Tree	[0, 128, 50]	dark green
2	Vegetation	[0, 220, 0]	bright green
3	Building	[255, 0, 0]	red
4	Road	[100, 100, 100]	dark gray
5	GuardRail	[200, 200, 200]	bright gray
6	TrafficSign	[255, 0, 255]	pink
7	TrafficLight	[255, 255, 0]	yellow
8	Pole	[128, 0, 255]	violet
9	Misc	[255, 200, 150]	skin
10	Truck	[0, 128, 255]	dark blue
11	Car	[0, 200, 255]	bright blue
12	Van	[255, 128, 0]	orange
13	Dont care	[0, 0, 0]	black

数据集生成细节

分割方法: 将原始序列分割成非重叠的子序列，进行6折交叉验证。
选择场景: 每个子序列选择15个场景/帧，以等距时间步避免数据重叠。

版本2的改进

问题修复: 修复了v1版本中由于错误的车辆窗户深度导致的投影错误。
新增类别: 引入新的语义类别（不关心类别），用于标记错误分类的体素。
质量提升: 将所有图像投影到世界空间，并插值处理带有不关心类别标签的点。

搜集汇总

数据集介绍

构建方式

VKITTI3D数据集是基于Virtual KITTI数据集构建的，专门用于评估点云的三维语义分割。数据集的构建过程首先涉及从Virtual KITTI中分割出非重叠的子序列，以进行6折交叉验证。每个子序列选取15个场景/帧，这些帧在时间步长上等距分布，以避免数据重叠。

使用方法

使用该数据集时，用户可以从提供的脚本中生成所有文件，或者直接从服务器下载。数据加载后，可以使用Python中的Numpy库读取点云数据。此外，数据集还提供了可视化工具，允许用户在安装必要的依赖项后，可视化原始的RGB点云及其对应的语义标签。

背景与挑战

背景概述

VKITTI3D数据集，旨在评估点云的三维语义分割，其直接源自Virtual KITTI数据集。该数据集被用于支持Engelmann等人2017年ICCV workshop论文《Exploring Spatial Context for 3D Semantic Segmentation of Point Clouds》的研究，主要研究人员来自于亚琛工业大学的视觉实验室。数据集的创建，是为了探索点云中空间上下文对于三维语义分割的影响，对相关领域如自动驾驶、机器人视觉等产生了重要影响。

当前挑战

该数据集在构建过程中遇到的挑战包括如何从Virtual KITTI数据集中准确提取并生成所需的点云格式，以及如何处理由于原始数据投影错误导致的分类问题。研究者在数据集的版本2中对这些问题进行了修正，引入了新的语义类别以处理错误分类的情况。在研究领域问题方面，该数据集面临的挑战包括提高三维点云的语义分割精度，以及如何有效利用空间上下文信息进行更准确的分割。

常用场景

经典使用场景

在三维点云的语义分割领域，VKITTI3D数据集提供了一个虚拟环境中的室外场景，其经典使用场景在于对点云数据进行精确的语义标注，以实现对不同对象的分类与识别，如地形、植被、建筑等。该数据集为研究人员提供了一个标准化的测试平台，以评估其算法在三维空间理解方面的性能。

解决学术问题

VKITTI3D数据集解决了传统三维语义分割中数据不足、标注质量参差不齐的问题。通过提供高质量的标注和多样的场景，该数据集为学术研究提供了可靠的基础，有助于提升算法在复杂环境下的泛化能力和准确性，进一步推动了三维点云处理技术的发展。

实际应用

在实际应用中，VKITTI3D数据集可被用于自动驾驶系统的感知模块训练，帮助车辆准确识别道路环境中的各类对象。此外，该数据集还可用于机器人导航、增强现实以及城市规划等领域，其应用前景十分广泛。

数据集最近研究