VisDrone2019

github2020-05-07 更新2024-05-31 收录

下载链接：

https://github.com/five-days/VisDrone-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集，包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境，包括行人、车辆、自行车等多种目标，以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集，手动标注了超过260万个目标边界框，并提供了场景可见性、对象类别和遮挡等重要属性。

The VisDrone2019 dataset was collected by the AISKYEYE team at the Machine Learning and Data Mining Laboratory of Tianjin University. It comprises 288 video clips totaling 261,908 frames and 10,209 static images. The dataset spans urban and rural environments across 14 different cities in China, encompassing a variety of targets such as pedestrians, vehicles, and bicycles, as well as both sparse and crowded scenes. The data was gathered using various models of drones under diverse weather and lighting conditions. Over 2.6 million target bounding boxes were manually annotated, with important attributes such as scene visibility, object category, and occlusion provided.

创建时间：

2020-05-07

原始信息汇总

数据集概述

名称: VisDrone-Dataset

描述: VisDrone-Dataset 是一个大规模的无人机视觉数据集，由天津大学机器学习和数据挖掘实验室的 AISKYEYE 团队收集。该数据集包含 288 个视频片段，总计 261,908 帧，以及 10,209 张静态图像。这些数据来自中国 14 个不同城市的无人机搭载摄像头，涵盖了多种环境、物体类型和密度。数据集中的帧经过手动标注，包含超过 2.6 百万个目标对象的边界框，以及场景可见性、对象类别和遮挡等重要属性。

数据集组成

视频数据: 288 个视频片段，共 261,908 帧
静态图像: 10,209 张
标注信息: 超过 2.6 百万个边界框，包含对象类别、场景可见性和遮挡信息

数据集应用任务

对象检测（图像）: 从无人机拍摄的单张图像中检测预定义类别的对象。
对象检测（视频）: 从视频中检测对象，与任务 1 类似。
单对象跟踪: 在视频序列中跟踪指定目标的状态。
多对象跟踪: 恢复视频中每个帧中对象的轨迹。
人群计数: 在每个视频帧中计数人员。

数据集下载

对象检测（图像）:
- trainset: 1.44 GB
- valset: 0.07 GB
- testset-dev: 0.28 GB (带标注)
- testset-challenge: 0.28 GB
对象检测（视频）:
- trainset: 7.53 GB
- valset: 1.49 GB
- testset-dev: 2.14 GB (带标注)
- testset-challenge: 2.70 GB
单对象跟踪:
- trainset_part1: 7.78 GB
- trainset_part2: 12.59 GB
- valset: 1.29 GB
- testset-dev: 11.27 GB (带标注)
- testset-challenge_part1: 17.40 GB
- testset-challenge_part2: 17.31 GB
- testset-challenge_initialization: 12 KB
多对象跟踪:
- trainset: 7.53 GB
- valset: 1.48 GB
- testset-dev: 2.14 GB (带标注)
- testset-challenge: 2.70 GB
人群计数:
- DroneCrowd: 1.03 GB

工具包

对象检测（图像）: Matlab beta
对象检测（视频）: Matlab beta
单对象跟踪: Matlab beta
多对象跟踪: Matlab beta
人群计数: 未提供具体工具包链接

搜集汇总

数据集介绍

构建方式

VisDrone2019数据集由天津大学AISKYEYE团队精心构建，涵盖了288个视频片段和10,209张静态图像，这些数据来源于中国14个不同城市的无人机拍摄。数据集的构建过程中，团队考虑了多种因素，包括地理位置、环境类型、目标对象及其密度等。所有图像和视频均在不同天气和光照条件下，通过多种型号的无人机平台采集。此外，数据集中的每一帧都经过人工标注，包含超过260万个目标边界框，并附有场景可见性、对象类别和遮挡情况等重要属性。

特点

VisDrone2019数据集以其多样性和广泛性著称，不仅包含了城市和乡村的不同场景，还涵盖了从稀疏到拥挤的各种目标密度。数据集的多样性体现在其跨越数千公里的地理位置分布，以及在不同天气和光照条件下的拍摄。此外，数据集提供了丰富的标注信息，包括目标的边界框、类别和遮挡状态，这些都为计算机视觉任务提供了宝贵的训练和测试资源。

使用方法

VisDrone2019数据集主要用于五个计算机视觉任务：图像中的目标检测、视频中的目标检测、单目标跟踪、多目标跟踪和人群计数。用户可以根据具体任务需求，下载相应的训练集、验证集和测试集。数据集提供了详细的下载链接和Matlab工具包，方便研究人员进行数据处理和模型训练。此外，数据集的测试集分为dev和challenge两种，其中dev集的标注信息可供研究人员用于论文发表。

背景与挑战

背景概述

随着无人机技术的广泛应用，如农业监测、空中摄影、快速配送和监控等，配备摄像头的无人机在各种场景中的使用日益增多。这促使了对无人机采集的视觉数据进行自动理解的需求，从而推动了计算机视觉与无人机技术的紧密结合。在此背景下，天津大学机器学习与数据挖掘实验室的AISKYEYE团队于2019年创建了VisDrone2019数据集，旨在为多种计算机视觉任务提供一个大规模的基准。该数据集包含288个视频片段和10,209张静态图像，覆盖了中国14个不同城市的多种环境、对象和场景密度，为研究者提供了丰富的数据资源。

当前挑战

VisDrone2019数据集面临的挑战主要集中在四个任务上：图像中的目标检测、视频中的目标检测、单目标跟踪和多目标跟踪。这些任务要求在复杂多变的无人机视角下，准确识别和跟踪目标，尤其是在不同天气和光照条件下。此外，数据集的构建过程中也面临了多样化的数据采集和高质量标注的挑战，确保数据的广泛性和准确性。这些挑战不仅推动了计算机视觉技术的发展，也为无人机应用提供了更强大的技术支持。

常用场景

经典使用场景

在无人机视觉领域，VisDrone2019数据集的经典使用场景主要集中在目标检测、单目标跟踪、多目标跟踪以及人群计数等任务上。通过该数据集，研究者能够训练和验证算法在复杂环境下的性能，尤其是在城市和乡村不同场景中的目标识别与跟踪能力。

衍生相关工作

基于VisDrone2019数据集，研究者们开发了多种先进的计算机视觉算法，包括改进的目标检测模型、高效的单目标和多目标跟踪系统以及精确的人群计数方法。这些工作不仅在学术界引起了广泛关注，也为工业界提供了实用的技术解决方案。

数据集最近研究