five

VisDrone2019|无人机视觉数据集|目标检测数据集

收藏
github2020-05-07 更新2024-05-31 收录
无人机视觉
目标检测
下载链接:
https://github.com/five-days/VisDrone-Dataset
下载链接
链接失效反馈
资源简介:
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

The VisDrone2019 dataset was collected by the AISKYEYE team at the Machine Learning and Data Mining Laboratory of Tianjin University. It comprises 288 video clips totaling 261,908 frames and 10,209 static images. The dataset spans urban and rural environments across 14 different cities in China, encompassing a variety of targets such as pedestrians, vehicles, and bicycles, as well as both sparse and crowded scenes. The data was gathered using various models of drones under diverse weather and lighting conditions. Over 2.6 million target bounding boxes were manually annotated, with important attributes such as scene visibility, object category, and occlusion provided.
创建时间:
2020-05-07
原始信息汇总

数据集概述

名称: VisDrone-Dataset

描述: VisDrone-Dataset 是一个大规模的无人机视觉数据集,由天津大学机器学习和数据挖掘实验室的 AISKYEYE 团队收集。该数据集包含 288 个视频片段,总计 261,908 帧,以及 10,209 张静态图像。这些数据来自中国 14 个不同城市的无人机搭载摄像头,涵盖了多种环境、物体类型和密度。数据集中的帧经过手动标注,包含超过 2.6 百万个目标对象的边界框,以及场景可见性、对象类别和遮挡等重要属性。

数据集组成

  • 视频数据: 288 个视频片段,共 261,908 帧
  • 静态图像: 10,209 张
  • 标注信息: 超过 2.6 百万个边界框,包含对象类别、场景可见性和遮挡信息

数据集应用任务

  1. 对象检测(图像): 从无人机拍摄的单张图像中检测预定义类别的对象。
  2. 对象检测(视频): 从视频中检测对象,与任务 1 类似。
  3. 单对象跟踪: 在视频序列中跟踪指定目标的状态。
  4. 多对象跟踪: 恢复视频中每个帧中对象的轨迹。
  5. 人群计数: 在每个视频帧中计数人员。

数据集下载

  • 对象检测(图像):

    • trainset: 1.44 GB
    • valset: 0.07 GB
    • testset-dev: 0.28 GB (带标注)
    • testset-challenge: 0.28 GB
  • 对象检测(视频):

    • trainset: 7.53 GB
    • valset: 1.49 GB
    • testset-dev: 2.14 GB (带标注)
    • testset-challenge: 2.70 GB
  • 单对象跟踪:

    • trainset_part1: 7.78 GB
    • trainset_part2: 12.59 GB
    • valset: 1.29 GB
    • testset-dev: 11.27 GB (带标注)
    • testset-challenge_part1: 17.40 GB
    • testset-challenge_part2: 17.31 GB
    • testset-challenge_initialization: 12 KB
  • 多对象跟踪:

    • trainset: 7.53 GB
    • valset: 1.48 GB
    • testset-dev: 2.14 GB (带标注)
    • testset-challenge: 2.70 GB
  • 人群计数:

    • DroneCrowd: 1.03 GB

工具包

AI搜集汇总
数据集介绍
main_image_url
构建方式
VisDrone2019数据集由天津大学AISKYEYE团队精心构建,涵盖了288个视频片段和10,209张静态图像,这些数据来源于中国14个不同城市的无人机拍摄。数据集的构建过程中,团队考虑了多种因素,包括地理位置、环境类型、目标对象及其密度等。所有图像和视频均在不同天气和光照条件下,通过多种型号的无人机平台采集。此外,数据集中的每一帧都经过人工标注,包含超过260万个目标边界框,并附有场景可见性、对象类别和遮挡情况等重要属性。
特点
VisDrone2019数据集以其多样性和广泛性著称,不仅包含了城市和乡村的不同场景,还涵盖了从稀疏到拥挤的各种目标密度。数据集的多样性体现在其跨越数千公里的地理位置分布,以及在不同天气和光照条件下的拍摄。此外,数据集提供了丰富的标注信息,包括目标的边界框、类别和遮挡状态,这些都为计算机视觉任务提供了宝贵的训练和测试资源。
使用方法
VisDrone2019数据集主要用于五个计算机视觉任务:图像中的目标检测、视频中的目标检测、单目标跟踪、多目标跟踪和人群计数。用户可以根据具体任务需求,下载相应的训练集、验证集和测试集。数据集提供了详细的下载链接和Matlab工具包,方便研究人员进行数据处理和模型训练。此外,数据集的测试集分为dev和challenge两种,其中dev集的标注信息可供研究人员用于论文发表。
背景与挑战
背景概述
随着无人机技术的广泛应用,如农业监测、空中摄影、快速配送和监控等,配备摄像头的无人机在各种场景中的使用日益增多。这促使了对无人机采集的视觉数据进行自动理解的需求,从而推动了计算机视觉与无人机技术的紧密结合。在此背景下,天津大学机器学习与数据挖掘实验室的AISKYEYE团队于2019年创建了VisDrone2019数据集,旨在为多种计算机视觉任务提供一个大规模的基准。该数据集包含288个视频片段和10,209张静态图像,覆盖了中国14个不同城市的多种环境、对象和场景密度,为研究者提供了丰富的数据资源。
当前挑战
VisDrone2019数据集面临的挑战主要集中在四个任务上:图像中的目标检测、视频中的目标检测、单目标跟踪和多目标跟踪。这些任务要求在复杂多变的无人机视角下,准确识别和跟踪目标,尤其是在不同天气和光照条件下。此外,数据集的构建过程中也面临了多样化的数据采集和高质量标注的挑战,确保数据的广泛性和准确性。这些挑战不仅推动了计算机视觉技术的发展,也为无人机应用提供了更强大的技术支持。
常用场景
经典使用场景
在无人机视觉领域,VisDrone2019数据集的经典使用场景主要集中在目标检测、单目标跟踪、多目标跟踪以及人群计数等任务上。通过该数据集,研究者能够训练和验证算法在复杂环境下的性能,尤其是在城市和乡村不同场景中的目标识别与跟踪能力。
衍生相关工作
基于VisDrone2019数据集,研究者们开发了多种先进的计算机视觉算法,包括改进的目标检测模型、高效的单目标和多目标跟踪系统以及精确的人群计数方法。这些工作不仅在学术界引起了广泛关注,也为工业界提供了实用的技术解决方案。
数据集最近研究
最新研究方向
在无人机视觉领域,VisDrone2019数据集的最新研究方向主要集中在多任务学习与跨域适应上。随着无人机应用场景的多样化,研究人员致力于开发能够同时处理图像检测、视频目标检测、单目标跟踪和多目标跟踪等多任务的模型,以提高算法的通用性和效率。此外,由于无人机拍摄环境的多变性,跨域适应技术也成为研究热点,旨在提升模型在不同光照、天气和地理条件下的鲁棒性。这些研究不仅推动了无人机视觉技术的发展,也为智能监控、农业监测等实际应用提供了强有力的技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

NIH Chest X-rays

Over 112,000 Chest X-ray images from more than 30,000 unique patients

kaggle 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

MIT Indoor Scenes

室内场景识别是高水平视觉中一个具有挑战性的开放性问题。大多数适用于室外场景的场景识别模型在室内领域的表现都较差。该数据库包含67个室内类别,共15620张图像。图像的数量因类别而异,但每个类别至少有100张图像。所有图像均为jpg格式。此处提供的图像仅用于研究目的。

阿里云天池 收录

FMA (Free Music Archive)

免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集

OpenDataLab 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录