CVD2014, LIVE-Qualcomm, KoNViD-1k, LIVE-VQC, YouTube-UGC, LBVD, LSVQ, LIVE-YT-Gaming

github2024-05-22 更新2024-05-31 收录

下载链接：

https://github.com/sunwei925/MinimalisticVQA

下载链接

链接失效反馈

资源简介：

这些数据集用于视频质量分析，包括不同来源和类型的视频数据，用于训练和测试视频质量模型。

These datasets are utilized for video quality analysis, encompassing video data from diverse sources and types, intended for training and testing video quality models.

创建时间：

2024-04-01

原始信息汇总

数据集概述

数据集列表

CVD2014
LIVE-Qualcomm
KoNViD-1k
LIVE-VQC
YouTube-UGC
LBVD
LSVQ
LIVE-YT-Gaming

数据集特殊说明

KoNViD-1k: 视频名称格式与官方发布版本不同，建议下载匹配的视频版本。
LSVQ: 官方链接可能失效，可下载非官方发布的版本。

模型定义

模型	空间质量分析器	时间质量分析器	LSVQ训练权重
Model I	ResNet-50 (ImageNet-1k)	None
Model II	ResNet-50 (pre-trained on IQA datasets)	None
Model III	ResNet-50 (pre-trained on the LSVQ dataset)	None
Model IV	ResNet-50 (ImageNet-1k)	SlowFast
Model V	ResNet-50 (pre-trained on IQA datasets)	SlowFast
Model VI	ResNet-50 (pre-trained on the LSVQ dataset)	SlowFast
Model VII	Swin-B (ImageNet-1k)	None
Model VIII	Swin-B (pre-trained on the LSVQ dataset)	None
Model IX	Swin-B (ImageNet-1k)	SlowFast	weights
Model X	Swin-B (pre-trained on the LSVQ dataset)	SlowFast

模型训练与测试

训练步骤

提取图像: 使用脚本从KoNViD-1k数据集中提取图像。
提取时间特征: 从KoNViD-1k数据集中提取时间特征。
模型训练: 使用Model IX对KoNViD-1k数据集进行训练。

测试步骤

下载并使用Model XI进行视频测试。

AI搜集汇总

数据集介绍

构建方式

该数据集的构建基于对视频质量评估（VQA）领域的深入研究，旨在通过设计简约的视频质量评估模型来分析现有VQA数据集。构建过程中，采用了视频预处理器进行时空降采样，结合空间质量分析器和可选的时间质量分析器，最终通过质量回归器输出结果。这一过程确保了模型的简约性和高效性，同时通过对比不同模型变体在多个VQA数据集上的表现，揭示了各数据集在评估视频质量方面的挑战和局限。

特点

该数据集的显著特点在于其涵盖了多种现实世界中的视频失真情况，包括但不限于CVD2014、LIVE-Qualcomm、KoNViD-1k等八个数据集。每个数据集均经过精心挑选和处理，以确保其能够真实反映用户在观看视频时的体验。此外，数据集的构建还特别关注了模型的泛化能力，通过对比不同模型在各数据集上的表现，提供了对当前视频质量评估技术进展的深刻见解。

使用方法

使用该数据集时，首先需下载相应的视频数据，并根据提供的脚本进行图像和时间特征的提取。随后，用户可以选择训练自己的模型或直接使用预训练模型进行测试。训练过程中，用户可根据具体需求调整参数，如学习率、批处理大小等。测试时，用户需加载预训练模型和缩放文件，输入待评估的视频文件，即可获得视频质量评分。整个过程通过简洁的命令行操作实现，便于用户快速上手和应用。

背景与挑战

背景概述

视频质量评估（VQA）在监控和提升终端用户观看体验方面扮演着不可或缺的角色，特别是在各种现实世界的视频媒体应用中。随着盲视频质量评估（BVQA）模型的不断进步，这些模型的性能主要通过少数人类评级的VQA数据集来衡量。因此，深入理解现有的VQA数据集对于准确评估BVQA领域的当前进展至关重要。本研究首次通过设计极简主义的BVQA模型对VQA数据集进行了计算分析，旨在揭示这些数据集的内在特性和潜在问题，从而为下一代VQA数据集和模型的构建提供指导。

当前挑战

尽管VQA数据集在视频质量评估领域具有重要意义，但它们在构建和使用过程中面临诸多挑战。首先，数据集的多样性和代表性不足，导致模型在不同数据集上的泛化能力受限。其次，数据集中的视频内容和失真类型各异，增加了模型训练的复杂性和难度。此外，数据集的动态更新和版本差异也带来了数据一致性和可重复性问题。这些挑战不仅影响了BVQA模型的性能评估，也制约了该领域研究的进一步发展。

常用场景

经典使用场景

在视频质量评估（VQA）领域，CVD2014, LIVE-Qualcomm, KoNViD-1k, LIVE-VQC, YouTube-UGC, LBVD, LSVQ, LIVE-YT-Gaming等数据集被广泛用于训练和验证盲视频质量评估（BVQA）模型。这些数据集包含了具有现实失真的视频样本，通过设计简约的BVQA模型，研究人员能够分析不同数据集的特性，从而评估当前BVQA模型的进展。

解决学术问题

这些数据集解决了视频质量评估领域中的关键学术问题，如视频失真类型的多样性、视频质量的主观评分与模型预测之间的关联性等。通过这些数据集，研究者能够深入理解视频质量评估模型的性能瓶颈，推动新一代VQA数据集和模型的设计与开发。

衍生相关工作

基于这些数据集，研究者们开发了多种简约的BVQA模型，如MinimalisticVQA系列模型。这些模型通过简化架构和基本模块的组合，展示了在不同VQA数据集上的泛化能力，为后续研究提供了新的思路和方法。

以上内容由AI搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集