five

CVD2014, LIVE-Qualcomm, KoNViD-1k, LIVE-VQC, YouTube-UGC, LBVD, LSVQ, LIVE-YT-Gaming|视频质量评估数据集|机器学习数据集

收藏
github2024-05-22 更新2024-05-31 收录
视频质量评估
机器学习
下载链接:
https://github.com/sunwei925/MinimalisticVQA
下载链接
链接失效反馈
资源简介:
这些数据集用于视频质量分析,包括不同来源和类型的视频数据,用于训练和测试视频质量模型。

These datasets are utilized for video quality analysis, encompassing video data from diverse sources and types, intended for training and testing video quality models.
创建时间:
2024-04-01
原始信息汇总

数据集概述

数据集列表

  • CVD2014
  • LIVE-Qualcomm
  • KoNViD-1k
  • LIVE-VQC
  • YouTube-UGC
  • LBVD
  • LSVQ
  • LIVE-YT-Gaming

数据集特殊说明

  • KoNViD-1k: 视频名称格式与官方发布版本不同,建议下载匹配的视频版本。
  • LSVQ: 官方链接可能失效,可下载非官方发布的版本。

模型定义

模型 空间质量分析器 时间质量分析器 LSVQ训练权重
Model I ResNet-50 (ImageNet-1k) None
Model II ResNet-50 (pre-trained on IQA datasets) None
Model III ResNet-50 (pre-trained on the LSVQ dataset) None
Model IV ResNet-50 (ImageNet-1k) SlowFast
Model V ResNet-50 (pre-trained on IQA datasets) SlowFast
Model VI ResNet-50 (pre-trained on the LSVQ dataset) SlowFast
Model VII Swin-B (ImageNet-1k) None
Model VIII Swin-B (pre-trained on the LSVQ dataset) None
Model IX Swin-B (ImageNet-1k) SlowFast weights
Model X Swin-B (pre-trained on the LSVQ dataset) SlowFast

模型训练与测试

训练步骤

  1. 提取图像: 使用脚本从KoNViD-1k数据集中提取图像。
  2. 提取时间特征: 从KoNViD-1k数据集中提取时间特征。
  3. 模型训练: 使用Model IX对KoNViD-1k数据集进行训练。

测试步骤

  • 下载并使用Model XI进行视频测试。
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对视频质量评估(VQA)领域的深入研究,旨在通过设计简约的视频质量评估模型来分析现有VQA数据集。构建过程中,采用了视频预处理器进行时空降采样,结合空间质量分析器和可选的时间质量分析器,最终通过质量回归器输出结果。这一过程确保了模型的简约性和高效性,同时通过对比不同模型变体在多个VQA数据集上的表现,揭示了各数据集在评估视频质量方面的挑战和局限。
特点
该数据集的显著特点在于其涵盖了多种现实世界中的视频失真情况,包括但不限于CVD2014、LIVE-Qualcomm、KoNViD-1k等八个数据集。每个数据集均经过精心挑选和处理,以确保其能够真实反映用户在观看视频时的体验。此外,数据集的构建还特别关注了模型的泛化能力,通过对比不同模型在各数据集上的表现,提供了对当前视频质量评估技术进展的深刻见解。
使用方法
使用该数据集时,首先需下载相应的视频数据,并根据提供的脚本进行图像和时间特征的提取。随后,用户可以选择训练自己的模型或直接使用预训练模型进行测试。训练过程中,用户可根据具体需求调整参数,如学习率、批处理大小等。测试时,用户需加载预训练模型和缩放文件,输入待评估的视频文件,即可获得视频质量评分。整个过程通过简洁的命令行操作实现,便于用户快速上手和应用。
背景与挑战
背景概述
视频质量评估(VQA)在监控和提升终端用户观看体验方面扮演着不可或缺的角色,特别是在各种现实世界的视频媒体应用中。随着盲视频质量评估(BVQA)模型的不断进步,这些模型的性能主要通过少数人类评级的VQA数据集来衡量。因此,深入理解现有的VQA数据集对于准确评估BVQA领域的当前进展至关重要。本研究首次通过设计极简主义的BVQA模型对VQA数据集进行了计算分析,旨在揭示这些数据集的内在特性和潜在问题,从而为下一代VQA数据集和模型的构建提供指导。
当前挑战
尽管VQA数据集在视频质量评估领域具有重要意义,但它们在构建和使用过程中面临诸多挑战。首先,数据集的多样性和代表性不足,导致模型在不同数据集上的泛化能力受限。其次,数据集中的视频内容和失真类型各异,增加了模型训练的复杂性和难度。此外,数据集的动态更新和版本差异也带来了数据一致性和可重复性问题。这些挑战不仅影响了BVQA模型的性能评估,也制约了该领域研究的进一步发展。
常用场景
经典使用场景
在视频质量评估(VQA)领域,CVD2014, LIVE-Qualcomm, KoNViD-1k, LIVE-VQC, YouTube-UGC, LBVD, LSVQ, LIVE-YT-Gaming等数据集被广泛用于训练和验证盲视频质量评估(BVQA)模型。这些数据集包含了具有现实失真的视频样本,通过设计简约的BVQA模型,研究人员能够分析不同数据集的特性,从而评估当前BVQA模型的进展。
解决学术问题
这些数据集解决了视频质量评估领域中的关键学术问题,如视频失真类型的多样性、视频质量的主观评分与模型预测之间的关联性等。通过这些数据集,研究者能够深入理解视频质量评估模型的性能瓶颈,推动新一代VQA数据集和模型的设计与开发。
衍生相关工作
基于这些数据集,研究者们开发了多种简约的BVQA模型,如MinimalisticVQA系列模型。这些模型通过简化架构和基本模块的组合,展示了在不同VQA数据集上的泛化能力,为后续研究提供了新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

QM9

QM9数据集包含134k个有机小分子化合物的量子化学计算结果,涵盖了12个量子化学性质,如分子能量、电离能、电子亲和能等。

quantum-machine.org 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

Global Elevation Data (GED)

全球高程数据集,提供全球范围内的高程信息,包括陆地和海洋地形。数据集包含高分辨率的高程数据,适用于地理信息系统(GIS)分析、地形建模和环境研究等领域。

lpdaac.usgs.gov 收录

ConPR

ConPR数据集由首尔国立大学的机械工程系创建,专注于一个活跃的建筑工地,用于多会话地点识别。该数据集包含12个序列,每个序列捕捉不同日期的建筑进度,涵盖多种环境如车道、楼梯和狭窄的森林道路。数据集包括RGB图像、LiDAR点云数据和IMU数据,支持视觉和LiDAR基础的地点识别技术,并提供基于范围的地点识别评估的地面真实信息。该数据集旨在推动在动态和挑战性环境中的地点识别算法的发展。

arXiv 收录