CVD2014, LIVE-Qualcomm, KoNViD-1k, LIVE-VQC, YouTube-UGC, LBVD, LSVQ, LIVE-YT-Gaming
收藏github2024-05-22 更新2024-05-31 收录
下载链接:
https://github.com/sunwei925/MinimalisticVQA
下载链接
链接失效反馈资源简介:
这些数据集用于视频质量分析,包括不同来源和类型的视频数据,用于训练和测试视频质量模型。
These datasets are utilized for video quality analysis, encompassing video data from diverse sources and types, intended for training and testing video quality models.
创建时间:
2024-04-01
原始信息汇总
数据集概述
数据集列表
- CVD2014
- LIVE-Qualcomm
- KoNViD-1k
- LIVE-VQC
- YouTube-UGC
- LBVD
- LSVQ
- LIVE-YT-Gaming
数据集特殊说明
- KoNViD-1k: 视频名称格式与官方发布版本不同,建议下载匹配的视频版本。
- LSVQ: 官方链接可能失效,可下载非官方发布的版本。
模型定义
| 模型 | 空间质量分析器 | 时间质量分析器 | LSVQ训练权重 |
|---|---|---|---|
| Model I | ResNet-50 (ImageNet-1k) | None | |
| Model II | ResNet-50 (pre-trained on IQA datasets) | None | |
| Model III | ResNet-50 (pre-trained on the LSVQ dataset) | None | |
| Model IV | ResNet-50 (ImageNet-1k) | SlowFast | |
| Model V | ResNet-50 (pre-trained on IQA datasets) | SlowFast | |
| Model VI | ResNet-50 (pre-trained on the LSVQ dataset) | SlowFast | |
| Model VII | Swin-B (ImageNet-1k) | None | |
| Model VIII | Swin-B (pre-trained on the LSVQ dataset) | None | |
| Model IX | Swin-B (ImageNet-1k) | SlowFast | weights |
| Model X | Swin-B (pre-trained on the LSVQ dataset) | SlowFast |
模型训练与测试
训练步骤
- 提取图像: 使用脚本从KoNViD-1k数据集中提取图像。
- 提取时间特征: 从KoNViD-1k数据集中提取时间特征。
- 模型训练: 使用Model IX对KoNViD-1k数据集进行训练。
测试步骤
- 下载并使用Model XI进行视频测试。
AI搜集汇总
数据集介绍

构建方式
该数据集的构建基于对视频质量评估(VQA)领域的深入研究,旨在通过设计简约的视频质量评估模型来分析现有VQA数据集。构建过程中,采用了视频预处理器进行时空降采样,结合空间质量分析器和可选的时间质量分析器,最终通过质量回归器输出结果。这一过程确保了模型的简约性和高效性,同时通过对比不同模型变体在多个VQA数据集上的表现,揭示了各数据集在评估视频质量方面的挑战和局限。
特点
该数据集的显著特点在于其涵盖了多种现实世界中的视频失真情况,包括但不限于CVD2014、LIVE-Qualcomm、KoNViD-1k等八个数据集。每个数据集均经过精心挑选和处理,以确保其能够真实反映用户在观看视频时的体验。此外,数据集的构建还特别关注了模型的泛化能力,通过对比不同模型在各数据集上的表现,提供了对当前视频质量评估技术进展的深刻见解。
使用方法
使用该数据集时,首先需下载相应的视频数据,并根据提供的脚本进行图像和时间特征的提取。随后,用户可以选择训练自己的模型或直接使用预训练模型进行测试。训练过程中,用户可根据具体需求调整参数,如学习率、批处理大小等。测试时,用户需加载预训练模型和缩放文件,输入待评估的视频文件,即可获得视频质量评分。整个过程通过简洁的命令行操作实现,便于用户快速上手和应用。
背景与挑战
背景概述
视频质量评估(VQA)在监控和提升终端用户观看体验方面扮演着不可或缺的角色,特别是在各种现实世界的视频媒体应用中。随着盲视频质量评估(BVQA)模型的不断进步,这些模型的性能主要通过少数人类评级的VQA数据集来衡量。因此,深入理解现有的VQA数据集对于准确评估BVQA领域的当前进展至关重要。本研究首次通过设计极简主义的BVQA模型对VQA数据集进行了计算分析,旨在揭示这些数据集的内在特性和潜在问题,从而为下一代VQA数据集和模型的构建提供指导。
当前挑战
尽管VQA数据集在视频质量评估领域具有重要意义,但它们在构建和使用过程中面临诸多挑战。首先,数据集的多样性和代表性不足,导致模型在不同数据集上的泛化能力受限。其次,数据集中的视频内容和失真类型各异,增加了模型训练的复杂性和难度。此外,数据集的动态更新和版本差异也带来了数据一致性和可重复性问题。这些挑战不仅影响了BVQA模型的性能评估,也制约了该领域研究的进一步发展。
常用场景
经典使用场景
在视频质量评估(VQA)领域,CVD2014, LIVE-Qualcomm, KoNViD-1k, LIVE-VQC, YouTube-UGC, LBVD, LSVQ, LIVE-YT-Gaming等数据集被广泛用于训练和验证盲视频质量评估(BVQA)模型。这些数据集包含了具有现实失真的视频样本,通过设计简约的BVQA模型,研究人员能够分析不同数据集的特性,从而评估当前BVQA模型的进展。
解决学术问题
这些数据集解决了视频质量评估领域中的关键学术问题,如视频失真类型的多样性、视频质量的主观评分与模型预测之间的关联性等。通过这些数据集,研究者能够深入理解视频质量评估模型的性能瓶颈,推动新一代VQA数据集和模型的设计与开发。
衍生相关工作
基于这些数据集,研究者们开发了多种简约的BVQA模型,如MinimalisticVQA系列模型。这些模型通过简化架构和基本模块的组合,展示了在不同VQA数据集上的泛化能力,为后续研究提供了新的思路和方法。
以上内容由AI搜集并总结生成



