Comyco Video Description Dataset

github2024-04-28 更新2024-05-31 收录

下载链接：

https://github.com/godka/Comyco-Video-Description-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

为了提高Comyco的泛化能力，我们提出一个包含电影、体育、电视节目、游戏、新闻和音乐视频的视频质量DASH数据集。具体来说，我们首先从YouTube收集最高分辨率的视频片段，然后使用FFmpeg通过H.264编解码器和MP4Box根据视频序列的编码梯度对视频进行编码。比特率梯度表示为{235, 375, 560, 750, 1050, 1750, 2350, 3000, 4300}kbps。每个块编码为4秒。在转码过程中，对于每个视频，我们分别以1920×1080的参考分辨率测量VMAF、VMAF-4K和VMAF-phone指标。总体而言，数据集包含86个完整视频，394,551个视频块和1,578,204个视频质量评估。

To enhance the generalization capability of Comyco, we propose a video quality DASH dataset encompassing movies, sports, TV shows, games, news, and music videos. Specifically, we first collected the highest resolution video clips from YouTube, then encoded the videos using FFmpeg with the H.264 codec and MP4Box according to the encoding gradient of the video sequences. The bitrate gradient is represented as {235, 375, 560, 750, 1050, 1750, 2350, 3000, 4300} kbps. Each chunk is encoded for 4 seconds. During the transcoding process, for each video, we measured the VMAF, VMAF-4K, and VMAF-phone metrics at a reference resolution of 1920×1080. Overall, the dataset comprises 86 full-length videos, 394,551 video chunks, and 1,578,204 video quality assessments.

创建时间：

2020-02-05

原始信息汇总

Comyco Video Dataset 概述

数据集内容

视频类型：包含电影、体育、电视节目、游戏、新闻和音乐视频。
视频来源：从YouTube收集最高分辨率的视频片段。
编码处理：使用FFmpeg通过H.264编解码器进行编码，并使用MP4Box根据编码梯度将视频转换为DASH格式。
比特率梯度：{235, 375, 560, 750, 1050, 1750, 2350, 3000, 4300}kbps。
视频片段时长：每个视频片段编码为4秒。
质量评估：对每个视频进行VMAF、VMAF-4K和VMAF-phone指标的测量，参考分辨率为1920 × 1080。
数据集规模：包含86个完整视频，总计394,551个视频片段和1,578,204次视频质量评估。

数据集下载

下载链接：完整视频数据集下载

搜集汇总

数据集介绍

构建方式

为了提升Comyco系统的泛化能力，研究团队构建了一个包含电影、体育、电视剧、游戏、新闻和音乐视频的多类别视频质量DASH数据集。该数据集的构建过程始于从YouTube收集最高分辨率的视频片段，随后利用FFmpeg工具通过H.264编解码器对视频进行编码，并使用MP4Box工具根据视频序列的编码梯度将视频转换为DASH格式。编码梯度设定为{235, 375, 560, 750, 1050, 1750, 2350, 3000, 4300}kbps，每个视频片段被编码为4秒的块。在转码过程中，每段视频均通过VMAF、VMAF-4K和VMAF-phone指标进行质量评估，参考分辨率为1920 × 1080。

特点

该数据集的显著特点在于其多样化的视频内容和精细的质量评估。数据集包含86个完整视频，共计394,551个视频块和1,578,204次视频质量评估，提供了丰富的数据资源。此外，通过多层次的编码梯度和多维度的质量评估指标，数据集能够全面反映不同比特率下的视频质量变化，为视频质量评估和优化研究提供了坚实的基础。

使用方法

用户可以通过提供的链接下载完整的视频数据集，并利用数据集中的视频块和质量评估结果进行视频质量分析、模型训练和算法验证。数据集的编码梯度和质量评估指标为研究者提供了多维度的分析视角，有助于深入探索视频传输和质量优化的技术细节。

背景与挑战

背景概述

随着视频流媒体技术的迅速发展，视频质量评估与自适应流媒体传输成为研究热点。Comyco Video Description Dataset由清华大学团队创建，旨在提升视频质量评估模型的泛化能力。该数据集涵盖了电影、体育、电视剧、游戏、新闻和音乐视频等多种视频类型，通过从YouTube采集高分辨率视频片段，并利用FFmpeg和MP4Box工具进行H.264编码和DASH化处理，构建了一个包含86个完整视频、394,551个视频片段及1,578,204次视频质量评估的庞大数据集。该数据集的创建不仅为视频质量评估提供了丰富的实验数据，还为自适应流媒体传输的研究提供了重要的基准。

当前挑战

Comyco Video Description Dataset的构建面临多重挑战。首先，视频片段的采集和编码过程需要处理不同类型的视频内容，确保数据集的多样性和代表性。其次，编码过程中需严格控制比特率梯度，以模拟真实的流媒体传输环境，这对编码工具的性能和稳定性提出了较高要求。此外，视频质量评估指标的计算，如VMAF、VMAF-4K和VMAF-phone，需要在不同分辨率下进行，确保评估结果的准确性和一致性。最后，数据集的规模庞大，如何高效存储和处理这些数据也是一个重要的技术挑战。

常用场景

经典使用场景

Comyco Video Description Dataset 主要用于视频质量评估和自适应流媒体传输的研究。该数据集通过收集高分辨率视频片段，并利用H.264编码和DASH技术生成不同比特率的视频流，为研究者提供了一个全面的视频质量评估平台。研究者可以利用该数据集进行视频质量感知模型（如VMAF）的训练和验证，以及自适应流媒体传输策略的优化。

实际应用

在实际应用中，Comyco Video Description Dataset 可用于优化视频流媒体服务，如Netflix、YouTube等平台。通过分析不同比特率下的视频质量，服务提供商可以制定更高效的自适应流媒体策略，确保在不同网络条件下提供最佳观看体验。此外，该数据集还可用于开发和测试视频压缩算法，以减少带宽消耗并提高视频传输效率。

衍生相关工作

基于Comyco Video Description Dataset，研究者已开展多项相关工作，包括视频质量感知模型的改进、自适应流媒体传输策略的优化以及跨平台视频质量评估的研究。这些工作不仅提升了视频流媒体服务的质量，还为视频压缩和传输技术的发展提供了新的思路。未来，该数据集有望继续推动视频质量评估和流媒体传输领域的创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集