photoface database, NYU Depth V2 dataset, SUN RGBD dataset, PASCAL3D+, IKEA, New Tsukuba Dataset, Oxford RobotCar Dataset, Middlebury V3, ShapeNet, MICC dataset, CMU MoCap Dataset, DTU dataset, MSR-Action3D, Florence-3D, Berkeley MHAD, Online Action Detection, ChaLearn LAP IsoGD Dataset, MAFA dataset, MSRC-12 Kinect Gesture Dataset, 2013 Chalearn Gesture Challenge dataset, WIDER FACE, FDDB, 300-VW dataset, HMDB51, MPII Cooking Activities Dataset, UCF101, IJB-A dataset, YouTube celebrities, COX, Human3.6M, iLIDS, VIPeR, CUHK01

github2023-06-04 更新2024-05-31 收录

下载链接：

https://github.com/MichaelBeechan/CV-Datasets

下载链接

链接失效反馈

官方服务：

资源简介：

该仓库包含多个计算机视觉领域的数据集，涵盖了从3D计算机视觉到图像中人类分析的各种数据集。每个数据集都有详细的介绍和备注，以及相关的网址链接。

This repository encompasses a variety of datasets in the field of computer vision, ranging from 3D computer vision to human analysis in images. Each dataset is accompanied by detailed descriptions and notes, along with relevant URL links.

创建时间：

2018-12-12

原始信息汇总

3D Computer Vision 数据集概述

photoface database

介绍: 基于光度立体视觉的二维和三维人脸识别数据库
备注: 总共7356张图像，包含1839个session和261个subjects
网址: None

NYU Depth V2 dataset

介绍: 关于RGBD 图像场景理解的数据库
备注: 提供1449张深度图片和他们的密集2d点类标注
网址: 链接

SUN RGBD dataset

介绍: 是上面的NYU Depth V2 dataset的超集，多了3D bounding boxes和room layouts的标注
备注: 有10,000张RGB-D图片，有58,657个3D包围框和146,617 个2d包围框
网址: 链接

PASCAL3D+

介绍: 新的三维物体检测和姿态估计数据集，从PASCAL VOC 演化而来，包含图像，注解，和3D CAD模型
备注: 总共12个类，平均每个类别有3000多个实例
网址: 链接

IKEA

介绍: 包含典型室内场景的三维模型的数据库，例如桌子椅子等
备注: 包含大约759张图片和219个3D模型
网址: 链接

New Tsukuba Dataset

介绍: 包含了很多立体物体对的数据库，用于立体物体匹配
备注: 总共1800个立体物体对，以及每立体对的立体视差图、遮挡图和不连续图
网址: 链接

Oxford RobotCar Dataset

介绍: 关于户外自动驾驶的数据集
备注: 包含在驾驶汽车过程从6个摄像头收集的2000w张图片，和当时的激光雷达，GPS和地面实况标注
网址: 链接

Middlebury V3

介绍: 包含高分辨率物体立体视差标注的数据库
备注: 包含33个类，没有明说每类有多少数据
网址: 链接

ShapeNet

介绍: 包含3D模型，和3d模型的类别标注的数据集，覆盖了常用的3D数据集PASCAL 3D+
备注: 它涵盖55个常见的对象类别，有大约51,300个3D模型
网址: 链接

MICC dataset

介绍: 包含了3D人脸扫描和在不同分辨率，条件和缩放级别下的几个视频序列的数据库
备注: 有53个人的立体人脸数据
网址: 链接

CMU MoCap Dataset

介绍: 包含了3D人体关键点标注和骨架移动标注的数据集
备注: 有6个类别和23个子类别，总共2605个数据
网址: 链接

DTU dataset

介绍: 关于3D场景的数据集
备注: 有124个场景，每场景有49/64个位置的RGB图像和结构光标注
网址: 链接

搜集汇总

数据集介绍

构建方式

该数据集的构建基于多源数据采集与标注，涵盖了从3D计算机视觉到人类行为分析的广泛领域。数据采集过程中，采用了高精度的传感器设备，如RGB-D摄像头、激光雷达等，以确保数据的多样性和精确性。标注工作则由专业团队完成，确保了数据的准确性和一致性。

特点

该数据集的特点在于其广泛的应用场景和丰富的数据类型。它不仅包含了大量的RGB-D图像、3D模型和视频序列，还涵盖了多种标注信息，如3D包围框、动作序列、人脸识别等。这些数据为计算机视觉、深度学习等领域的研究提供了坚实的基础。

使用方法

该数据集的使用方法多样，适用于多种研究任务。研究人员可以通过下载数据集，利用其丰富的标注信息进行模型训练和测试。数据集还提供了详细的文档和示例代码，帮助用户快速上手。此外，数据集支持多种格式，便于与现有的深度学习框架集成。

背景与挑战

背景概述

近年来，随着计算机视觉技术的飞速发展，三维视觉、动作识别、人脸检测等领域的研究逐渐成为热点。多个知名数据集应运而生，如NYU Depth V2、SUN RGBD、PASCAL3D+等，这些数据集为研究者提供了丰富的标注数据，推动了相关领域的算法创新与应用落地。NYU Depth V2数据集由纽约大学于2012年发布，专注于RGB-D图像场景理解，提供了1449张深度图像及其密集的2D点类标注。SUN RGBD数据集则在此基础上扩展，增加了3D包围框和房间布局的标注，进一步提升了场景理解的精度。PASCAL3D+数据集则从PASCAL VOC演化而来，专注于三维物体检测与姿态估计，涵盖了12个类别的3000多个实例。这些数据集的创建为三维视觉、场景理解等领域的算法研究提供了坚实的基础。

当前挑战

尽管这些数据集在推动计算机视觉领域的发展中发挥了重要作用，但仍面临诸多挑战。首先，数据集的标注质量与多样性直接影响算法的泛化能力。例如，NYU Depth V2和SUN RGBD数据集虽然在场景理解方面提供了丰富的标注，但其数据规模相对有限，难以覆盖所有可能的场景变化。其次，三维数据的获取与标注成本较高，导致数据集规模受限。PASCAL3D+数据集虽然提供了3D CAD模型，但其类别数量较少，难以满足复杂场景的需求。此外，数据集的构建过程中还面临数据隐私、标注一致性等问题，尤其是在涉及人脸、动作等敏感数据的场景中，如何平衡数据开放与隐私保护成为一大挑战。

常用场景

经典使用场景

在计算机视觉领域，NYU Depth V2数据集被广泛用于深度学习和场景理解的研究。该数据集提供了1449张深度图像及其密集的2D点类标注，使得研究人员能够开发出更精确的算法来解析复杂的三维环境。

解决学术问题

NYU Depth V2数据集解决了在RGBD图像场景理解中的多个关键问题，如物体识别、场景分割和深度估计。通过提供详细的深度信息和标注，该数据集帮助研究人员克服了在复杂环境中进行精确三维重建和理解的挑战。

衍生相关工作

基于NYU Depth V2数据集，许多经典的研究工作得以展开，包括深度学习的场景解析算法、三维物体检测和姿态估计技术。这些研究不仅推动了计算机视觉领域的发展，也为相关技术的实际应用奠定了坚实的基础。

以上内容由遇见数据集搜集并总结生成