KITTI, TUM
收藏github2024-01-19 更新2024-05-31 收录
下载链接:
https://github.com/haohaoalt/hao_datasets
下载链接
链接失效反馈官方服务:
资源简介:
KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,用于评测立体图像、光流、视觉测距、3D物体检测和3D跟踪等技术。数据集包含市区、乡村和高速公路等场景的真实图像数据,每张图像中最多达15辆车和30个行人,还有各种程度的遮挡与截断。TUM RGB-D数据集由在不同的室内场景使用Microsoft Kinect传感器记录的39个序列组成,用于测试和调试、手持SLAM、机器人SLAM、结构与纹理对比、动态物体、三维物体重建等任务。
The KITTI dataset, jointly established by the Karlsruhe Institute of Technology in Germany and the Toyota Technological Institute at Chicago, is designed for evaluating technologies such as stereo imaging, optical flow, visual odometry, 3D object detection, and 3D tracking. The dataset includes real-world image data from urban, rural, and highway scenes, with up to 15 vehicles and 30 pedestrians in each image, along with varying degrees of occlusion and truncation. The TUM RGB-D dataset consists of 39 sequences recorded using the Microsoft Kinect sensor in various indoor environments, intended for tasks such as testing and debugging, handheld SLAM, robotic SLAM, structure and texture comparison, dynamic objects, and 3D object reconstruction.
创建时间:
2022-10-22
原始信息汇总
KITTI数据集概述
数据集来源与用途: KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,用于评测立体图像、光流、视觉测距、3D物体检测和3D跟踪等计算机视觉技术在车载环境下的性能。
数据集内容:
- 包含市区、乡村和高速公路等场景的真实图像数据。
- 每张图像中最多达15辆车和30个行人,以及各种程度的遮挡与截断。
- 数据集由389对立体图像和光流图,39.2 km视觉测距序列以及超过200k 3D标注物体的图像组成。
- 数据采集频率为10Hz。
数据集分类:
- 原始数据集被分类为 ’Road’, ’City’, ’Residential’, ’Campus’ 和 ’Person’。
- 对于3D物体检测,label细分为car, van, truck, pedestrian, pedestrian(sitting), cyclist, tram以及misc。
数据采集平台: 装配有2个灰度摄像机,2个彩色摄像机,一个Velodyne 64线3D激光雷达,4个光学镜头,以及1个GPS导航系统。
数据集地址: http://www.cvlibs.net/datasets/kitti
TUM RGB-D数据集概述
数据集来源与用途: TUM RGB-D数据集由在不同的室内场景使用Microsoft Kinect传感器记录的39个序列组成,用于多种任务的性能测试,包括Testing and Debugging, Handheld SLAM, Robot SLAM, Structure vs. Texture, Dynamic Objects, 3D Object Reconstruction, Validation Files, Calibration Files。
数据集内容:
- 包含rgb及depth文件夹,分别存放rgb图像及深度图。
accelerometer.txt存放加速度信息。groundtruth.txt为外部运动捕捉系统采集到的相机位姿。
数据集格式:
- 可下载tgz压缩包格式或ros bag格式。
- bag包中的图像以15Hz的频率发布,imu以500Hz频率发布。
数据集工具:
- 提供多种工具,如
add_pointclouds_to_bagfile.py,associate.py,evaluate_ate.py等。
数据集地址:
- 工具下载:https://vision.in.tum.de/data/datasets/rgbd-dataset/tools
- 数据集下载:https://vision.in.tum.de/data/datasets/rgbd-dataset/download
搜集汇总
数据集介绍

构建方式
KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合构建,旨在为自动驾驶场景下的计算机视觉算法提供评测基准。数据采集平台配备了2个灰度摄像机、2个彩色摄像机、1个Velodyne 64线3D激光雷达、4个光学镜头以及1个GPS导航系统,覆盖了市区、乡村和高速公路等多种场景。数据集以10Hz的频率同步采集,包含389对立体图像和光流图、39.2 km的视觉测距序列以及超过200k的3D标注物体图像。TUM数据集则通过Microsoft Kinect传感器在室内场景中记录,包含39个序列,涵盖了手持SLAM、机器人SLAM、动态物体等多种任务,数据以15Hz的频率发布,并提供了RGB图像、深度图像以及IMU数据。
使用方法
KITTI数据集的使用方法包括下载原始数据后,根据任务需求选择相应的数据子集。对于视觉测距任务,可以使用odometry页面的数据,并结合raw数据集进行GPS融合效果的验证。TUM数据集则可以通过下载tgz压缩包或rosbag格式的数据,使用提供的工具如`associate.py`生成RGB和深度图像的匹配信息,并通过`evaluate_ate.py`和`evaluate_rpe.py`进行绝对误差和相对误差的评估。此外,TUM数据集还支持将rosbag格式转换为TUM格式,便于与其他SLAM算法进行对比实验。
背景与挑战
背景概述
KITTI和TUM数据集是计算机视觉和机器人领域中极具影响力的基准数据集。KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院于2012年联合创建,旨在为自动驾驶场景下的计算机视觉算法提供评测平台。该数据集涵盖了立体图像、光流、视觉测距、3D物体检测和跟踪等多个任务,数据采集于市区、乡村和高速公路等多样化场景,包含了丰富的真实世界数据。TUM数据集则由慕尼黑工业大学开发,专注于室内环境下的RGB-D数据采集,广泛应用于SLAM、3D重建等任务。这两个数据集为相关领域的研究提供了宝贵的资源,推动了自动驾驶、机器人导航等技术的进步。
当前挑战
KITTI数据集在构建过程中面临的主要挑战包括数据采集的复杂性和标注的准确性。由于数据采集平台需要集成多种传感器(如摄像机、激光雷达、GPS等),确保各传感器数据的同步性和一致性成为一大难题。此外,3D物体检测和跟踪任务需要对大量数据进行精确标注,尤其是在遮挡和截断情况下,标注的准确性直接影响算法的性能。TUM数据集则面临室内环境下的动态物体和低纹理场景的挑战,这些场景容易导致SLAM算法的失效。同时,RGB-D数据的采集和处理需要克服传感器噪声和数据对齐的问题,以确保后续算法的鲁棒性和精度。
常用场景
经典使用场景
KITTI和TUM数据集在自动驾驶和机器人领域的应用尤为广泛。KITTI数据集通过其丰富的立体图像、光流、视觉测距和3D物体检测数据,为自动驾驶算法的开发与验证提供了坚实的基础。TUM数据集则以其RGB-D数据在室内环境中的SLAM、3D重建和动态物体检测等任务中表现出色,成为机器人导航和环境感知研究的重要工具。
解决学术问题
KITTI数据集解决了自动驾驶领域中视觉测距、3D物体检测和跟踪等关键问题,推动了计算机视觉技术在车载环境中的应用。TUM数据集则通过提供高质量的RGB-D数据,解决了室内SLAM、动态物体检测和3D重建等学术难题,为机器人导航和环境感知研究提供了可靠的数据支持。
实际应用
KITTI数据集在实际应用中,被广泛用于自动驾驶汽车的开发与测试,帮助提升车辆在复杂环境中的感知与决策能力。TUM数据集则在服务机器人、仓储机器人和家庭机器人等领域中发挥了重要作用,通过其精确的室内环境数据,提升了机器人的导航与操作精度。
数据集最近研究
最新研究方向
KITTI和TUM数据集在自动驾驶和机器人领域的应用持续扩展,尤其是在视觉测距(Visual Odometry)和同步定位与地图构建(SLAM)技术的研究中。KITTI数据集凭借其丰富的多传感器数据和高精度标注,成为评估3D物体检测、光流估计和视觉测距算法的基准。近年来,研究者们致力于提升算法在复杂场景下的鲁棒性,特别是在动态物体和遮挡情况下的表现。TUM数据集则因其多样化的室内场景和精确的RGB-D数据,广泛应用于手持SLAM和机器人导航的研究中。当前的研究热点包括多传感器融合、深度学习在SLAM中的应用,以及实时性和精度的优化。这些研究不仅推动了自动驾驶和机器人技术的发展,也为相关领域的算法创新提供了重要的数据支持。
以上内容由遇见数据集搜集并总结生成



