five

CVD2014, LIVE-Qualcomm, KoNViD-1k, LIVE-VQC, YouTube-UGC, LBVD, LSVQ, LIVE-YT-Gaming

收藏
github2024-05-22 更新2024-05-31 收录
下载链接:
https://github.com/sunwei925/MinimalisticVQA
下载链接
链接失效反馈
资源简介:
这些数据集用于视频质量分析,包括不同来源和类型的视频数据,用于训练和测试视频质量模型。

These datasets are utilized for video quality analysis, encompassing video data from diverse sources and types, intended for training and testing video quality models.
创建时间:
2024-04-01
原始信息汇总

数据集概述

数据集列表

  • CVD2014
  • LIVE-Qualcomm
  • KoNViD-1k
  • LIVE-VQC
  • YouTube-UGC
  • LBVD
  • LSVQ
  • LIVE-YT-Gaming

数据集特殊说明

  • KoNViD-1k: 视频名称格式与官方发布版本不同,建议下载匹配的视频版本。
  • LSVQ: 官方链接可能失效,可下载非官方发布的版本。

模型定义

模型 空间质量分析器 时间质量分析器 LSVQ训练权重
Model I ResNet-50 (ImageNet-1k) None
Model II ResNet-50 (pre-trained on IQA datasets) None
Model III ResNet-50 (pre-trained on the LSVQ dataset) None
Model IV ResNet-50 (ImageNet-1k) SlowFast
Model V ResNet-50 (pre-trained on IQA datasets) SlowFast
Model VI ResNet-50 (pre-trained on the LSVQ dataset) SlowFast
Model VII Swin-B (ImageNet-1k) None
Model VIII Swin-B (pre-trained on the LSVQ dataset) None
Model IX Swin-B (ImageNet-1k) SlowFast weights
Model X Swin-B (pre-trained on the LSVQ dataset) SlowFast

模型训练与测试

训练步骤

  1. 提取图像: 使用脚本从KoNViD-1k数据集中提取图像。
  2. 提取时间特征: 从KoNViD-1k数据集中提取时间特征。
  3. 模型训练: 使用Model IX对KoNViD-1k数据集进行训练。

测试步骤

  • 下载并使用Model XI进行视频测试。
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对视频质量评估(VQA)领域的深入研究,旨在通过设计简约的视频质量评估模型来分析现有VQA数据集。构建过程中,采用了视频预处理器进行时空降采样,结合空间质量分析器和可选的时间质量分析器,最终通过质量回归器输出结果。这一过程确保了模型的简约性和高效性,同时通过对比不同模型变体在多个VQA数据集上的表现,揭示了各数据集在评估视频质量方面的挑战和局限。
特点
该数据集的显著特点在于其涵盖了多种现实世界中的视频失真情况,包括但不限于CVD2014、LIVE-Qualcomm、KoNViD-1k等八个数据集。每个数据集均经过精心挑选和处理,以确保其能够真实反映用户在观看视频时的体验。此外,数据集的构建还特别关注了模型的泛化能力,通过对比不同模型在各数据集上的表现,提供了对当前视频质量评估技术进展的深刻见解。
使用方法
使用该数据集时,首先需下载相应的视频数据,并根据提供的脚本进行图像和时间特征的提取。随后,用户可以选择训练自己的模型或直接使用预训练模型进行测试。训练过程中,用户可根据具体需求调整参数,如学习率、批处理大小等。测试时,用户需加载预训练模型和缩放文件,输入待评估的视频文件,即可获得视频质量评分。整个过程通过简洁的命令行操作实现,便于用户快速上手和应用。
背景与挑战
背景概述
视频质量评估(VQA)在监控和提升终端用户观看体验方面扮演着不可或缺的角色,特别是在各种现实世界的视频媒体应用中。随着盲视频质量评估(BVQA)模型的不断进步,这些模型的性能主要通过少数人类评级的VQA数据集来衡量。因此,深入理解现有的VQA数据集对于准确评估BVQA领域的当前进展至关重要。本研究首次通过设计极简主义的BVQA模型对VQA数据集进行了计算分析,旨在揭示这些数据集的内在特性和潜在问题,从而为下一代VQA数据集和模型的构建提供指导。
当前挑战
尽管VQA数据集在视频质量评估领域具有重要意义,但它们在构建和使用过程中面临诸多挑战。首先,数据集的多样性和代表性不足,导致模型在不同数据集上的泛化能力受限。其次,数据集中的视频内容和失真类型各异,增加了模型训练的复杂性和难度。此外,数据集的动态更新和版本差异也带来了数据一致性和可重复性问题。这些挑战不仅影响了BVQA模型的性能评估,也制约了该领域研究的进一步发展。
常用场景
经典使用场景
在视频质量评估(VQA)领域,CVD2014, LIVE-Qualcomm, KoNViD-1k, LIVE-VQC, YouTube-UGC, LBVD, LSVQ, LIVE-YT-Gaming等数据集被广泛用于训练和验证盲视频质量评估(BVQA)模型。这些数据集包含了具有现实失真的视频样本,通过设计简约的BVQA模型,研究人员能够分析不同数据集的特性,从而评估当前BVQA模型的进展。
解决学术问题
这些数据集解决了视频质量评估领域中的关键学术问题,如视频失真类型的多样性、视频质量的主观评分与模型预测之间的关联性等。通过这些数据集,研究者能够深入理解视频质量评估模型的性能瓶颈,推动新一代VQA数据集和模型的设计与开发。
衍生相关工作
基于这些数据集,研究者们开发了多种简约的BVQA模型,如MinimalisticVQA系列模型。这些模型通过简化架构和基本模块的组合,展示了在不同VQA数据集上的泛化能力,为后续研究提供了新的思路和方法。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作