VDPVE

Name: VDPVE
Creator: 上海交通大学图像通信与网络工程研究所
Published: 2023-03-16 21:11:16
License: 暂无描述

arXiv2023-03-16 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2303.09290v1

下载链接

链接失效反馈

官方服务：

资源简介：

VDPVE数据集由上海交通大学图像通信与网络工程研究所构建，包含1211个经过不同增强处理的视频，旨在评估视频增强质量与人类视觉感知的匹配度。数据集分为三个子集：第一个子集包含600个视频，经过色彩、亮度和对比度增强；第二个子集包含310个视频，进行去模糊处理；第三个子集包含301个视频，进行去抖动处理。数据集通过邀请21名受试者进行主观评分，以获取每视频的平均意见分数（MOS）。VDPVE不仅推动了视频质量评估方法的发展，也在一定程度上提升了视频增强技术的性能。

The VDPVE dataset was constructed by the Institute of Image Communication and Network Engineering at Shanghai Jiao Tong University. It comprises 1,211 videos subjected to various enhancement treatments, aiming to evaluate the consistency between video enhancement quality and human visual perception. The dataset is divided into three subsets: the first subset includes 600 videos processed for color, brightness and contrast enhancements; the second subset contains 310 videos treated with deblurring; the third subset consists of 301 videos stabilized via de-jittering. Subjective scoring was conducted by inviting 21 participants to obtain the Mean Opinion Score (MOS) for each individual video. The VDPVE dataset not only promotes the development of video quality assessment methodologies, but also improves the performance of video enhancement technologies to a certain extent.

提供机构：

上海交通大学图像通信与网络工程研究所

创建时间：

2023-03-16

搜集汇总

数据集介绍

构建方式

在视频质量评估领域，针对增强视频的专项数据集尚属空白。VDPVE数据集的构建过程系统而严谨，其核心在于整合多源原始视频并应用前沿增强算法。研究团队从LIVE-Qualcomm、V3C1、KoNViD-1k等公开数据集中精选了184段原始视频，统一调整为1280×720分辨率与8-10秒时长。随后，采用共计20种不同的增强方法，涵盖色彩亮度对比度调整、去模糊和视频稳像三大类别，生成了1211段增强视频。为确保数据质量，研究者剔除了32段存在严重失真的样本，最终形成三个子数据集。每个增强视频均通过邀请21位受试者进行主观评分，经无效数据剔除与分数归一化处理后，计算出平均意见分数，为客观质量评估模型提供了可靠的真值基准。

特点

VDPVE数据集在视频处理领域展现出鲜明的特色与价值。其首要特点在于针对性强，专门面向视频增强任务的质量评估，填补了该细分领域的资源空缺。数据集规模可观且结构清晰，包含的1211段视频被科学划分为三个子集：600段涉及色彩、亮度与对比度增强，310段专注于去模糊处理，301段则为去抖动视频，这种分类便于针对特定增强类型开展深入研究。视频内容具有高度多样性，源数据来自多个权威数据集，覆盖了丰富的场景与失真类型。更为重要的是，所有增强视频均附有经过严格主观实验获取的平均意见分数，其置信区间控制严谨，数据可靠性强。这些特征使得VDPVE成为推动增强视频质量评估算法发展的关键基石。

使用方法

VDPVE数据集为视频质量评估研究提供了规范化的应用框架。研究者可依据其预设划分，将数据集按7:1:2的比例分为训练集、验证集和测试集，且确保源自同一原始视频的增强样本归于同一集合，以评估模型泛化能力。该数据集主要用于训练与验证无参考或全参考视频质量评估模型，特别是针对色彩增强、去模糊、稳像等处理后的视频质量预测。在模型开发阶段，可利用训练集学习视觉质量特征与主观评分间的映射关系，通过验证集进行超参数调优。最终，在独立测试集上以皮尔逊线性相关系数、斯皮尔曼等级相关系数等指标量化模型性能。此外，该数据集亦可用于横向对比不同VQA算法在增强视频上的表现，或作为基准测试平台推动新方法的创新。

背景与挑战

背景概述

随着社交媒体应用的飞速发展，对高质量视频的需求日益增长，视频增强技术应运而生，旨在从色彩、亮度、对比度及稳定性等多维度提升视频观感。然而，如何评估增强后视频的质量，使其与人类视觉感知保持一致，成为视频处理领域的重要研究课题。现有视频质量评估方法多聚焦于整体失真度计算，缺乏专门针对视频增强的评估体系及公开数据集。为此，上海交通大学的研究团队于2023年构建了VDPVE数据集，该数据集包含1211个经过不同增强处理的视频，涵盖色彩亮度对比度增强、去模糊和去抖动三大子集，并通过主观实验获取了每个视频的平均意见分数。VDPVE的推出填补了视频增强质量评估数据集的空白，为相关算法的发展提供了重要基础。

当前挑战

VDPVE数据集致力于解决视频增强质量评估这一特定领域问题，其核心挑战在于如何准确量化人类对增强视频的主观感知，并建立与客观算法之间的可靠关联。现有通用视频质量评估方法往往难以捕捉增强操作引入的复杂视觉变化，例如色彩调整可能同时改善观感但引入噪声，去抖动处理在稳定画面的同时可能导致画面裁剪，这些微妙平衡使得质量评估变得尤为困难。在数据集构建过程中，研究人员面临多重挑战：首先，需从多样化的源数据集中筛选原始视频，确保内容代表性并统一分辨率与时长；其次，整合多种增强方法，包括传统算法、深度学习模型及商业软件，处理参数设置与结果一致性；此外，主观实验的设计与执行需严格控制环境、参与者筛选及评分流程，以获取可靠的人类感知数据，并处理无效评分以确保数据质量。

常用场景

经典使用场景

在视频处理领域，随着社交媒体应用的蓬勃发展，用户对视频质量的要求日益提升，各类视频增强技术应运而生。VDPVE数据集作为首个专注于感知视频增强的质量评估数据集，其经典使用场景在于为视频增强算法的客观质量评估提供基准测试平台。该数据集涵盖了色彩、亮度、对比度增强、去模糊和去抖动等多种增强类型，通过主观实验获取了每个增强视频的平均意见分数，为研究者验证和比较不同视频质量评估方法的性能提供了丰富且可靠的实验数据。

解决学术问题

VDPVE数据集解决了视频增强领域长期存在的学术研究问题，即缺乏专门针对增强视频的质量评估标准。传统视频质量评估方法主要关注失真视频的整体质量，难以准确反映增强后视频的感知质量。该数据集通过构建包含1211个增强视频的大规模样本，并基于主观评分生成平均意见分数，填补了视频增强质量评估数据集的空白。这不仅促进了针对视频增强的客观质量评估方法的发展，还为优化视频增强算法的性能提供了量化依据，推动了视频处理技术的进步。

衍生相关工作

VDPVE数据集的发布衍生了一系列相关的经典研究工作，主要集中在视频质量评估方法的创新与验证上。例如，基于该数据集，研究者测试了V-BLIINDS、TLVQM、VIDEVAL等多种先进质量评估算法的性能，其中FastVQA在整体数据集上表现出色，而TLVQM在去抖动子集上取得最佳结果。这些工作不仅验证了现有方法在视频增强场景下的适用性，还推动了如SimpleVQA等新型无参考评估模型的发展，为视频增强质量评估领域的算法优化和标准建立提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集