YouTube-Objects v2.3

github2023-08-23 更新2024-05-31 收录

下载链接：

https://github.com/vkalogeiton/yto-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由从YouTube收集的10个移动对象类别的视频组成，用于PASCAL VOC挑战。此版本提供了与YTO v2.2相同的7,000个边界框注释，格式为PASCAL VOC 2007。在训练集中，每帧标注一个实例，而在测试集中，标注了所需对象类的所有实例。

This dataset consists of videos of 10 moving object categories collected from YouTube, intended for the PASCAL VOC Challenge. This release includes 7,000 bounding box annotations identical to those in YTO v2.2, formatted in the PASCAL VOC 2007 standard. In the training set, one instance is annotated per frame, while in the test set, all instances of the required object categories are annotated.

创建时间：

2017-09-27

原始信息汇总

YouTube-Objects v2.3

描述

该数据集由从YouTube收集的视频组成，涵盖PASCAL VOC挑战中的10个移动物体类别。此版本提供了与YTO v2.2相同的7,000个边界框注释，格式为PASCAL VOC 2007。在训练集中，我们对每一帧标注一个实例，而在测试集中，我们对所需物体类别的所有实例进行标注。

下载

下载并解压名为YTOdevkit的目录： bash curl http://calvin-vision.net/bigstuff/YTOv2.3/YTOdevkit.tar.gz | tar xz
进入YTOdevkit目录： bash cd YTOdevkit
下载并解压VOCdevkit代码： bash curl http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar | tar x --strip-components 1 VOCdevkit/VOCcode
下载并解压YouTube-Objects v2.3的图像集、注释和jpg图像： bash curl http://calvin-vision.net/bigstuff/YTOv2.3/YTOImageSets.tar.gz | tar xz -C YTO/ curl http://calvin-vision.net/bigstuff/YTOv2.3/YTOAnnotations.tar.gz | tar xz -C YTO/ curl http://calvin-vision.net/bigstuff/YTOv2.3/YTOJPEGImages.tar.gz | tar xz -C YTO/

目录结构如下：

YTOdevkit/ # 开发工具包 ├── results/ # YTO 结果 ├── VOCcode/ # VOC 实用代码 ├── YTO/ # 图像集、注释等 │ ├── Annotations/ │ ├── ImageSets/ │ └── JPEGImages/ └── ...

引用

如果您在研究中使用了YouTube-Objects v2.3，请考虑引用以下文献：

@article{kalogeiton16pami, title={Analysing domain shift factors between videos and images for object detection}, author={Kalogeiton, Vicky and Ferrari, Vittorio and Schmid, Cordelia}, journal={IEEE transactions on pattern analysis and machine intelligence}, volume={38}, number={11}, pages={2327--2334}, year={2016}, publisher={IEEE} }

搜集汇总

数据集介绍

构建方式

YouTube-Objects v2.3数据集构建于YouTube视频资源，专注于PASCAL VOC挑战中的10个移动物体类别。该版本延续了YTO v2.2的7,000个边界框标注，并采用PASCAL VOC 2007格式进行标注。在训练集中，每帧仅标注一个实例，而在测试集中则标注了目标类别的所有实例，以确保数据的多样性和全面性。

特点

该数据集的特点在于其专注于视频中的移动物体检测，提供了丰富的边界框标注信息。数据集涵盖了10个类别的物体，标注格式与PASCAL VOC 2007兼容，便于与现有计算机视觉算法进行对比和评估。此外，训练集和测试集的标注策略不同，训练集每帧标注一个实例，而测试集标注所有实例，这为模型训练和评估提供了更全面的数据支持。

使用方法

使用YouTube-Objects v2.3数据集时，用户需先下载并解压`YTOdevkit`目录，随后获取`VOCdevkit`代码以及图像集、标注和JPEG图像。数据集的结构清晰，包含开发工具、结果目录、VOC工具代码以及图像集、标注和图像文件。用户可通过数据集查看器探索标注帧，并利用提供的工具进行模型训练和评估。

背景与挑战

背景概述

YouTube-Objects v2.3数据集由Vicky Kalogeiton、Vittorio Ferrari和Cordelia Schmid等研究人员于2016年创建，旨在解决视频与图像之间对象检测的领域转移问题。该数据集包含从YouTube收集的10个移动物体类别的视频，这些类别与PASCAL VOC挑战赛中的类别一致。数据集提供了7,000个边界框注释，采用PASCAL VOC 2007格式，训练集中每帧标注一个实例，测试集中则标注所有目标类别的实例。该数据集为视频对象检测领域的研究提供了重要的基准，推动了跨域对象检测技术的发展。

当前挑战

YouTube-Objects v2.3数据集在构建和应用过程中面临多重挑战。首先，视频与图像之间的领域差异显著，视频中的对象通常具有复杂的运动背景和动态变化，这增加了对象检测的难度。其次，数据集的标注过程需要大量人工干预，尤其是在视频帧中精确标注多个实例时，耗时且容易出错。此外，视频数据的多样性和复杂性使得模型在跨域迁移学习中难以保持高精度，这对算法的鲁棒性和泛化能力提出了更高要求。这些挑战不仅影响了数据集的构建效率，也对后续的研究工作提出了更高的技术门槛。

常用场景

经典使用场景

YouTube-Objects v2.3数据集广泛应用于视频对象检测领域，特别是在研究视频帧中的动态对象识别和跟踪方面。该数据集通过提供来自YouTube的10个PASCAL VOC挑战类别的视频，为研究者提供了一个丰富的资源，用于训练和测试视频中的对象检测算法。

实际应用

在实际应用中，YouTube-Objects v2.3数据集被用于开发智能监控系统、自动驾驶技术以及增强现实应用中的对象识别模块。通过利用该数据集训练的高效检测模型，这些系统能够更准确地识别和跟踪视频中的动态对象，从而提高系统的整体性能和用户体验。

衍生相关工作

基于YouTube-Objects v2.3数据集，许多经典的研究工作得以展开，包括视频对象检测算法的优化、跨领域对象检测模型的迁移学习研究等。这些工作不仅推动了视频分析技术的发展，还为相关领域的研究者提供了宝贵的参考和实验数据。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集