VSUMM Dataset

github2024-10-14 更新2024-10-16 收录

下载链接：

https://github.com/sandraavila/vsumm

下载链接

链接失效反馈

官方服务：

资源简介：

VSUMM数据集包含50个从Open Video项目中获取的视频，这些视频以MPEG-1格式存储，分辨率为352 x 240像素，帧率为30 fps，总时长约为75分钟。数据集还包括250个用户手动创建的视频摘要，每个视频有5个不同的用户摘要，以及50个由VSUMM算法生成的视频摘要。

The VSUMM Dataset comprises 50 videos retrieved from the Open Video Project. These videos are stored in MPEG-1 format, with a resolution of 352 × 240 pixels, a frame rate of 30 fps, and a total duration of approximately 75 minutes. The dataset also includes 250 manually created video summaries: each original video is paired with 5 distinct user-generated summaries, as well as 50 video summaries generated by the VSUMM algorithm.

创建时间：

2024-10-13

原始信息汇总

VSUMM (Video SUMMarization) 数据集概述

数据集简介

VSUMM (Video SUMMarization) 数据集包含视频摘要相关的数据，包括视频、用户摘要、VSUMM 摘要以及其他方法的摘要。该数据集源自论文 VSUMM: A mechanism designed to produce static video summaries and a novel evaluation method。

数据集内容

视频数据

来源: 50 个视频来自 Open Video。
格式: MPEG-1 格式 (30 fps, 352 x 240 像素)，彩色，带声音。
时长: 视频时长从 1 到 4 分钟不等，总时长约 75 分钟。
类型: 纪录片、教育、短暂、历史、讲座等。

用户摘要

数量: 250 个用户摘要。
创建方式: 50 个用户手动创建，每个用户处理 5 个视频，每个视频有 5 个不同的用户摘要。

VSUMM 摘要

数量: 50 个 VSUMM 摘要。
版本:
- VSUMM<sub>1</sub> 摘要
- VSUMM<sub>2</sub> 摘要

其他方法摘要

OV 摘要: 50 个摘要 (数据集提供者)。
DT 摘要: 50 个摘要 [Mundur et al., 2006]。
STIMO 摘要: 50 个摘要 [Furini et al., 2010]。

新数据集

来源: 50 个视频来自 YouTube 等网站。
类型: 卡通、新闻、体育、广告、电视节目和家庭视频。
时长: 视频时长从 1 到 10 分钟不等。

新用户摘要

数量: 250 个用户摘要。
创建方式: 50 个用户手动创建，每个用户处理 5 个视频，每个视频有 5 个不同的用户摘要。

新 VSUMM 摘要

数量: 50 个 VSUMM 摘要。

数据集下载

单文件下载: VSUMM.zip
分文件下载:

数据集评估方法

CUS 评估方法: 使用 CUS.jar 进行评估，具体使用方法见 README 文件。

结果展示

视频摘要结果: 每个视频的摘要结果以 PDF 格式提供，具体见 README 文件中的表格。

引用

@article{de2011vsumm, title={VSUMM: A mechanism designed to produce static video summaries and a novel evaluation method}, author={De Avila, Sandra Eliza Fontes and Lopes, Ana Paula Brandao and da Luz Jr, Antonio and de Albuquerque Ara{u}jo, Arnaldo}, journal={Pattern recognition letters}, volume={32}, number={1}, pages={56--68}, year={2011}, publisher={Elsevier} }

搜集汇总

数据集介绍

构建方式

在视频摘要领域，VSUMM数据集的构建基于对视频帧的颜色特征提取和k-means聚类算法。该数据集包含了从Open Video项目中选取的50个视频，这些视频涵盖了多种类型，如纪录片、教育片、历史片等，时长从1分钟到4分钟不等。此外，数据集还包括了由50名用户手动创建的250个视频摘要，每个视频对应5个不同的用户摘要。通过这种方式，VSUMM数据集不仅提供了自动生成的视频摘要，还包含了用户生成的摘要，从而为视频摘要技术的评估提供了丰富的对比资源。

使用方法

使用VSUMM数据集时，研究者可以首先下载包含视频和摘要的压缩文件，然后根据需要提取相应的数据。数据集中的每个视频都附有多个用户生成的摘要和自动生成的摘要，研究者可以通过对比这些摘要来评估不同视频摘要算法的性能。此外，数据集还提供了一个CUS评估方法，该方法通过比较用户摘要和自动摘要的相似度来量化摘要的质量。研究者可以使用提供的jar文件运行CUS评估方法，通过指定输入文件和参数来生成评估结果，从而对视频摘要算法进行客观的评价和比较。

背景与挑战

背景概述

视频摘要技术作为视频处理领域的重要分支，旨在通过自动生成视频的简短摘要，提升大规模视频集合的浏览效率和内容索引的便捷性。VSUMM数据集由Sandra Eliza Fontes de Avila等人于2011年创建，主要研究人员包括Sandra Eliza Fontes de Avila、Ana Paula Brandao Lopes、Antonio da Luz Jr.和Arnaldo de Albuquerque Araújo。该数据集的核心研究问题是如何生成静态视频摘要，并提出了一种新的评估方法，以减少评估任务中的主观性，量化摘要质量，并允许对不同技术进行更客观的比较。VSUMM数据集的发布对视频摘要领域的研究产生了深远影响，为后续研究提供了宝贵的实验数据和评估基准。

当前挑战

VSUMM数据集在构建过程中面临多项挑战。首先，视频摘要的生成需要从视频帧中提取关键信息，这涉及到复杂的特征提取和聚类算法。其次，评估视频摘要的质量是一个主观且复杂的过程，需要设计新的评估方法以减少主观性并提高评估的客观性。此外，数据集的多样性和视频内容的复杂性增加了摘要生成的难度，要求算法在不同类型的视频中均能有效工作。最后，数据集的构建和维护需要大量的计算资源和时间，这也是一个不容忽视的挑战。

常用场景

经典使用场景

在视频摘要领域，VSUMM数据集的经典使用场景主要集中在自动生成静态视频摘要。通过提取视频帧中的颜色特征并应用k-means聚类算法，该数据集能够生成一系列关键帧，从而形成视频的静态摘要。这种技术不仅加速了视频内容的浏览，还提高了内容索引和访问的效率。

解决学术问题

VSUMM数据集解决了视频摘要领域中的几个关键学术问题。首先，它提供了一种机制来生成静态视频摘要，解决了视频内容冗长和信息过载的问题。其次，它引入了一种新的评估方法，减少了评估任务中的主观性，量化了摘要质量，并允许更客观地比较不同技术。这些贡献显著推动了视频摘要技术的研究进展。

实际应用

在实际应用中，VSUMM数据集被广泛用于视频内容的快速浏览和高效索引。例如，在新闻、教育、纪录片等领域，用户可以通过生成的视频摘要快速获取关键信息，而无需观看整个视频。此外，该数据集还被用于视频搜索引擎和内容推荐系统，提高了用户体验和信息检索的效率。

数据集最近研究