DukeMTMC, LFW, PRW, CUHK-SYSU, MPII, AIchallenge, Kitti, COCO, XJTU2017, DeepInsight, ImageNet/ILSVRC2015

github2023-11-29 更新2024-05-31 收录

下载链接：

https://github.com/DeepInsight-PCALab/Dataset-Catalog-

下载链接

链接失效反馈

官方服务：

资源简介：

DukeMTMC: 多轨迹多摄像头跟踪数据集。LFW: 人脸验证数据集，包括RGB图像、灰度图像和提取的特征。PRW: 人物搜索/重新识别数据集，包括图像、边界框和掩码。CUHK-SYSU: 人物搜索/重新识别数据集，包括图像、边界框和掩码。MPII: 2D姿态估计数据集，包括图像、处理过的掩码和关键点注释。AIchallenge: 2D多人姿态估计数据集，包括图像、边界框和关键点注释。Kitti: 自动驾驶数据集，包括立体和光流图像对、立体视觉里程计序列和3D对象注释。COCO: 检测/姿态估计/分割数据集。XJTU2017: 交通线检测、交通标志检测、车辆检测、车道保持监控、车辆距离估计数据集，包括图像、交通线、交通标志边界框和类型、车辆边界框、车辆距离。DeepInsight: 自建交通线检测数据集，包括图像、手工标注的交通线、一些图像和标签处理代码、几个预训练模型。ImageNet/ILSVRC2015: 大规模视觉识别挑战数据集。

DukeMTMC: A multi-trajectory multi-camera tracking dataset. LFW: A face verification dataset, including RGB images, grayscale images, and extracted features. PRW: A person search/re-identification dataset, including images, bounding boxes, and masks. CUHK-SYSU: A person search/re-identification dataset, including images, bounding boxes, and masks. MPII: A 2D pose estimation dataset, including images, processed masks, and keypoint annotations. AIchallenge: A 2D multi-person pose estimation dataset, including images, bounding boxes, and keypoint annotations. Kitti: An autonomous driving dataset, including stereo and optical flow image pairs, stereo visual odometry sequences, and 3D object annotations. COCO: A detection/pose estimation/segmentation dataset. XJTU2017: A dataset for traffic line detection, traffic sign detection, vehicle detection, lane keeping monitoring, and vehicle distance estimation, including images, traffic lines, traffic sign bounding boxes and types, vehicle bounding boxes, and vehicle distances. DeepInsight: A self-built traffic line detection dataset, including images, manually annotated traffic lines, some image and label processing code, and several pre-trained models. ImageNet/ILSVRC2015: A large-scale visual recognition challenge dataset.

创建时间：

2018-03-06

原始信息汇总

数据集概述

1. DukeMTMC

名称: DukeMTMC
路径: /data3/DukeMTMC
大小: 1.4T
关键词: Multi-Track Multi-Camera Tracking
其他信息: 包括RGB图像、灰度图像、提取的特征

2. LFW

名称: LFW
路径: /data3/LFW
大小: 472.6G
关键词: Face Verification
其他信息: 包括RGB图像、灰度图像、提取的特征

3. PRW

名称: PRW
路径: /data3/PRW
大小: 152.2G
关键词: Person Search/Re-identification
其他信息: 包括图像、边界框、掩码

4. CUHK-SYSU

名称: CUHK-SYSU
路径: /data3/CUHK_Person_Search
大小: 98.1G
关键词: Person Search/Re-identification
其他信息: 包括图像、边界框、掩码

5. MPII

名称: MPII
路径: /data3/MPII
大小: 24G
关键词: 2D Pose Estimation
其他信息: 包括图像、处理过的掩码和关键点注释

6. AIchallenge

名称: AIchallenge
路径: /data3/AIchallenge
大小: 29G
关键词: 2D Multi-Person Pose Estimation
其他信息: 包括图像、边界框和关键点注释

7. Kitti

名称: Kitti
路径: /data3/Kitti
大小: 357G
关键词: Autonomous Driving
其他信息: 包括立体和光流图像对、立体视觉里程序列和3D对象注释

8. COCO

名称: COCO
路径: /data3/MSCOCO
大小: 140G
关键词: Detection/ Pose Estimation/ Segmentation

9. XJTU2017

名称: XJTU2017
路径: /data3/XJTU2017
大小: 25.9G
关键词: Traffic Line Detection; Traffic Sign Detection; Vehicle Detection; Lane Keeping Monitoring; Vehicle Distance Estimation
其他信息: 包括图像、交通线、交通标志边界框和类型、车辆边界框、车辆距离

10. DeepInsight

名称: DeepInsight
路径: /data3/DeepInsight
大小: 296G
关键词: Self-constructed dataset for traffic line detection (under development)
其他信息: 包括图像、手工标注的交通线、一些图像和标签处理的代码、几个预训练模型

11. ImageNet/ILSVRC2015

名称: ImageNet/ILSVRC2015
路径: /data3/ImageNet/ILSVRC2015
大小: 179G
关键词: Object Detection; Object Tracking
其他信息: 包括竞赛数据：对象检测和视频对象检测

12. ImageNet/ILSVRC2017

名称: ImageNet/ILSVRC2017
路径: /data3/Imagenet/ILSVRC2017
大小: 359G
关键词: Object detection from video
其他信息: 包括Imagenet 2017挑战的所有数据，由DET和VID子集组成

13. ALOV

名称: ALOV
路径: /data3/alov
大小: 11G
关键词: Object Tracking
其他信息: 包括注释和图像

14. Cityscapes

名称: Cityscapes
路径: /data3/Cityscapes
大小: 31G
关键词: Segmentation; Detection

15. KAIST_Infrared_Pedestrain

名称: KAIST_Infrared_Pedestrain
路径: /data3/KAIST_Infrared_Pedestrain
大小: 36G
关键词: Pedestrian Detection
其他信息: 包括RGB图像、红外图像和标记的边界框

16. RESIDE

名称: RESIDE
路径: /data3/RESIDE
大小: 98G
关键词: Single Image Dehazing
其他信息: 包括RGB对(雾&清洁)、灰度图像(传输图)

17. pku_Rain

名称: pku_Rain
路径: /data3/pku_Rain/rainALL_ALL
大小: 8.6G
关键词: Deraining, rain removal from a single image
其他信息: 包括RGB对(雨&清洁)、标记的雨条

18. Snow100K

名称: Snow100K
路径: /data3/Snow
大小: 16G
关键词: Desnow/ Snow Removal
其他信息: 包括RGB对(雪&清洁)、标记的雪位置

19. NYU depth v2

名称: NYU depth v2
路径: /data3/NYU_depth
大小: 428G
关键词: Depth Estimation from RGB Image

20. PASCAL VOC

名称: PASCAL VOC
路径: /data3/PASCAL/VOCdevkit
大小: 3G
关键词: Object Detection; Segmentation
其他信息: 包括VOC2007和VOC2012

21. CIFAR 10

名称: CIFAR 10
路径: /data3/cifar10
大小: 236M
关键词: Object Recognition

22. CIFAR 100

名称: CIFAR 100
路径: /data3/cifar100
大小: 939M
关键词: Object Recognition

23. SVHN

名称: SVHN
路径: /data3/SVHN
大小: 2.5G
关键词: Number Recognition

24. HMDB-51

名称: HMDB-51
路径: /data3/hmdb51
大小: 2.1G
关键词: Human Motion Recognition

25. DAVIS 17

名称: DAVIS 17
路径: /data3/DAVIS17
大小: 12G
关键词: Video Segmentation

26. DAVIS 16

名称: DAVIS 16
路径: /data3/DAVIS-data-origin
大小: 7.2G
关键词: Video Segmentation

27. Tsinghua-Tencent 100K

名称: Tsinghua-Tencent 100K
路径: /data3/Tsinghua_Tencent_100K
大小: 24.5G
关键词: Traffic Sign Detection

28. Traffic Light Datasets

名称: Traffic Light Datasets
路径: /data3/TrafficLight
大小: 36G
关键词: Traffic Sign Detection

29. SUN RGBD

名称: SUN RGBD
路径: /data3/SUNRGBD
大小: 7.39G
关键词: Depth Estimation; RGBD object classification

30. VOT

名称: VOT
路径: /data3/VOT
大小: 1.9G
关键词: Video Object Tracking
其他信息: 包括vot2014和vot 2015

31. Charades

名称: Charades
路径: /data3/Charades
大小: 396G
关键词: Video Recognition & Video Caption
其他信息: 包括视频、原始大小的流以及缩放到480p的流，以及由帧和光流计算的两流特征，评估代码也提供

32. MOT

名称: MOT
路径: /data3/MOT
大小: 1.9G
关键词: Multiple-Object Tracking
其他信息: 包括mot数据集的训练和测试数据，如果需要，还包括由flownet2.0提取的光流

33. MPI-Sintel

名称: MPI-Sintel
路径: /data3/MPI_Sintel
大小: 12G
关键词: Optical flow estimation
其他信息: 包括MPI-Sintel数据集的所有训练和测试数据，特别是用于评估光流算法性能

34. FlyingThings

名称: FlyingThings
路径: /data3/FlyingThings
大小: 1.3T
关键词: Optical flow estimation
其他信息: 包括训练和测试数据以及转换为tensorflow tfrecords文件的数据，其中光流仅从左视图转换，顺序为into_future

35. FlyingChairs

名称: FlyingChairs
路径: /data3/FlyingChairs/FlyingChairs
大小: 1.1T
关键词: Optical flow estimation
其他信息: 包括训练和测试数据以及转换为tensorflow tfrecords文件的数据

36. Broden

名称: Broden
路径: /data3/Broden
大小: 1G
关键词: CNN Interpretbility; Network Dissection
其他信息: 用于解释CNN中解耦表示的数据集

37. CASIA WebFace

名称: CASIA WebFace
路径: /data3/CASIA_WebFace
大小: 8.9G
关键词: Face Recognition/Verification

38. Market1501

名称: Market1501
路径: /data3/Market1501
大小: 2.6G
关键词: Person Re-identification

39. MARS

名称: MARS
路径: /data3/MARS
大小: 19G
关键词: Video-based Person Re-identification

40. CUHK03

名称: CUHK03
路径: /data3/CUHK03
大小: 8.7G
关键词: Person Re-identification

41. GraspingRectangleDataset

名称: GraspingRectangleDataset
路径: /data3/GraspingRectangle/
大小: 10G
关键词: RGBD detection
其他信息: 用于检测机器人抓取的数据集

42. Visual Genome

名称: Visual Genome
路径: /data3/Visual_Genome
大小: 15G
关键词: Visual Relationship Detection
其他信息: Visual Genome是一个数据集，一个知识库，一个持续努力连接结构化图像概念到语言

43. Human 3.6M

名称: Human 3.6M
路径: /data3/Human36M
大小: 32G
关键词: RGBD Human Pose Estimation
其他信息: 用于从RGBD数据检测人体关键点的数据集

44. UCF-101

名称: UCF-101
路径: /data3/UCF-all-in-one
大小: 94G
关键词: Video analysis
其他信息: 包括UCF-101(原始视频)、ucf_frame(视频帧)和ucf_transed(光流)

45. DiDi Self-Driving Dataset

名称: DiDi Self-Driving Dataset
路径: /data3/DiDi
大小: ~500G
关键词: 3D Object Detection with multiple sensors

46. DOTA

名称: DOTA
路径: /data3/DOTA
大小: 20G
关键词: Aerial Images; Small Object Detection
其他信息: 用于航空图像中的小对象检测的大型数据集

47. PoseTrack

名称: PoseTrack
路径: /data3/Posetrack
大小: 33G
关键词: Pose estimation; Tracking
其他信息: PoseTrack是一个用于视频中人体姿态估计和跟踪的大型基准

48. WIDER Person Search

名称: WIDER Person Search
路径: /data3/WIDER_Person_Search
大小: 12G
关键词: Person Search; Person Detection; Re-identification
其他信息: WIDER Face & Pedestrain Challenge - Track 3: Person Search

49. VisDrone

名称: VisDrone
路径: /data3/VisDrone
大小: 14G
关键词: Bird-view detection; Drone survallence detection
其他信息: 包括图像和标签

50. SmartCity

名称: SmartCity
路径: /data3/smartcity
大小: 28G
关键词: Action Recognition

51. RGBT234

名称: RGBT234
路径: /data3/RGBT234
大小: 7.76G
关键词: RGB-T tracking, Thermal image
其他信息: 包括RGB图像和热图像

52. TB-100

名称: TB-100
路径: /data3/TB-100
大小: 2.76G
关键词: Visual Tracker
其他信息: 包括RGB图像和地面实况

53. Youtube-8M

名称: Youtube-8M
路径: /data3/Youtube-8M
大小: 1.8T
关键词:

54. CUB-200-2011

名称: CUB-200-2011
路径: /data3/CUB_200_2011
大小: 1.1G
关键词: Bird Classification

55. Online Product

名称: Online Product
路径: /data3/Online_Product
大小: 2.9G
关键词: Product Retrieval

56. Automated Driving 3D Point Cloud Segmentation

名称: Automated Driving 3D Point Cloud Segmentation
路径: /data3/3D_Point_Cloud_Segmentation
大小: 86.5G
关键词: Dataset for automated driving 3D point cloud segmentation

57. LaSOT

名称: LaSOT
路径: /data3/LaSOT
大小: 227G
关键词: Large-scale Single Object Tracking (LaSOT)
其他信息: 包括图像和标签

58. AIChallenger Caption

名称: AIChallenger Caption
路径: /data3/ai_challenger_caption
大小: 21.7G
关键词:

59. UCF_Crime

名称: UCF_Crime
路径: /data3/UCF_Crime
大小: 208G
关键词: a dataset for anomaly detection, including initial video, generated images and optical flows

60. KTH

名称: KTH
路径: /data3/KTH
大小: 1G
关键词: The current video database containing six types of human actions (walking, jogging, running, boxing, hand waving and hand clapping).

61. AirbusShipDetection

名称: AirbusShipDetection
路径:
大小:
关键词:
其他信息:

搜集汇总

数据集介绍

构建方式

ILSVRC2015数据集作为ImageNet大规模视觉识别挑战赛的重要组成部分，其构建过程依托于ImageNet数据库，涵盖了超过1000个类别的图像数据。数据集的构建采用了严格的标注流程，每张图像均经过人工标注，确保类别标签的准确性。此外，数据集还包含了视频对象检测（VID）任务的数据，通过从视频序列中提取帧并进行标注，进一步扩展了其应用范围。

特点

ILSVRC2015数据集以其大规模和高多样性著称，涵盖了自然场景中的多种对象类别，为计算机视觉任务提供了丰富的训练和测试数据。其特点在于不仅包含静态图像，还引入了视频对象检测任务，使得数据集能够支持更复杂的视觉分析任务。数据集的标注信息包括对象类别、边界框以及视频帧的时间序列信息，为多任务学习提供了坚实的基础。

使用方法

ILSVRC2015数据集广泛应用于对象检测、对象跟踪等计算机视觉任务的研究与开发。研究人员可通过下载数据集并加载其标注信息，使用深度学习框架进行模型训练与评估。对于视频对象检测任务，数据集提供了帧序列及其对应的标注信息，支持时间序列建模与多帧联合分析。此外，数据集的标准化格式便于与其他视觉数据集进行联合使用，以提升模型的泛化能力。

背景与挑战

背景概述

ILSVRC2015数据集是ImageNet大规模视觉识别挑战赛（ImageNet Large Scale Visual Recognition Challenge, ILSVRC）的一部分，由斯坦福大学、普林斯顿大学等机构的研究人员共同创建。该数据集于2015年发布，旨在推动计算机视觉领域的发展，特别是在目标检测和目标跟踪任务上。ILSVRC2015包含了海量的图像和视频数据，涵盖了1000个类别的物体，为深度学习模型提供了丰富的训练和测试资源。该数据集在推动卷积神经网络（CNN）等技术的进步中发挥了关键作用，成为计算机视觉领域的基准数据集之一。

当前挑战

ILSVRC2015数据集在解决目标检测和目标跟踪问题时面临多重挑战。首先，数据集中包含的物体类别繁多且场景复杂，模型需要具备强大的泛化能力以应对多样化的视觉环境。其次，目标跟踪任务要求模型在视频序列中持续准确地定位目标，这对算法的鲁棒性和实时性提出了极高要求。在数据集构建过程中，研究人员还需处理海量数据的标注问题，确保每一帧图像中的目标边界框和类别标签的准确性，这对标注团队的工作量和精度提出了巨大挑战。此外，数据集的规模庞大，存储和处理这些数据需要高性能的计算资源，进一步增加了研究门槛。

常用场景

经典使用场景

ILSVRC2015数据集在计算机视觉领域中被广泛用于对象检测和视频对象检测任务。该数据集包含了大量的标注图像和视频，为研究者提供了一个标准化的平台，用于开发和评估新的算法。特别是在深度学习模型的训练和验证过程中，ILSVRC2015数据集因其丰富的类别和高质量的标注而成为首选。

实际应用

在实际应用中，ILSVRC2015数据集被广泛用于自动驾驶、视频监控和智能安防系统。通过利用该数据集训练的模型，能够实现对交通标志、行人、车辆等对象的实时检测和跟踪，从而提升系统的安全性和智能化水平。此外，该数据集还在医疗影像分析、无人机监控等领域展现了其重要价值。

衍生相关工作

ILSVRC2015数据集催生了许多经典的研究工作，特别是在深度学习和卷积神经网络（CNN）领域。基于该数据集的研究成果包括Faster R-CNN、YOLO和SSD等著名的对象检测算法。这些算法不仅在学术界引起了广泛关注，还在工业界得到了广泛应用，推动了计算机视觉技术的快速发展。

以上内容由遇见数据集搜集并总结生成