VideoSet

Name: VideoSet
Creator: 南加州大学
Published: 2017-01-15 12:30:59
License: 暂无描述

arXiv2017-01-15 更新2024-06-21 收录

下载链接：

https://ieee-dataport.org/documents/videoset

下载链接

链接失效反馈

官方服务：

资源简介：

VideoSet是由南加州大学媒体通信实验室主导创建的大规模压缩视频质量数据集，包含220个5秒长的视频序列，涵盖四种分辨率（1920×1080, 1280×720, 960×540, 640×360）。该数据集通过H.264编码，使用QP参数从1到51进行编码，并通过30多名受试者测量前三个JND点。VideoSet旨在通过JND测量，为视频编码研究和标准化工作提供重要数据支持，解决视频编码技术中的感知质量问题。

VideoSet is a large-scale compressed video quality dataset led by the Media Communications Laboratory of the University of Southern California. It contains 220 5-second video sequences covering four resolutions: 1920×1080, 1280×720, 960×540 and 640×360. All sequences are encoded via H.264 with QP parameters ranging from 1 to 51, and the first three JND points of the dataset were measured by over 30 test subjects. VideoSet aims to provide critical data support for video coding research and standardization efforts through JND measurements, addressing perceptual quality issues in video coding technologies.

提供机构：

南加州大学

创建时间：

2017-01-06

搜集汇总

数据集介绍

构建方式

在视频编码质量评估领域，传统率失真理论难以准确反映人类视觉系统的非线性感知特性。VideoSet数据集的构建采用了基于恰可察觉差异（JND）的测量方法，通过大规模主观实验采集数据。研究团队从公开数据集中精选了220段5秒视频源，统一处理为3840×2160分辨率，并下采样至1080p、720p、540p和360p四种分辨率。使用H.264编码器对每个视频片段以量化参数（QP）1至51进行编码，通过改进的二分搜索流程，组织超过30名受试者对每个视频片段的前三个JND点进行系统化测量。实验在深圳六所高校的58个标准化测试站完成，确保了数据采集环境的多样性与可靠性。

使用方法

VideoSet数据集为视频编码与质量评估研究提供了实证基础，其使用方法主要体现在三个层面。研究者可通过IEEE DataPort公开获取所有源视频、编码视频及标注的JND数据，用于开发基于机器学习的JND预测模型，实现从视频内容特征到感知阈值的映射。数据集支持将JND分布转换为用户满意率曲线，从而建立以特定用户群体满意度为目标的率控制策略，为感知编码标准的优化提供理论依据。此外，通过分析不同视频内容（如高运动场景与静态特写）的JND分布差异，可深入探究掩蔽效应等视觉机制对压缩伪影感知的影响，推动数据驱动的视频编码算法创新。

背景与挑战

背景概述

随着数字视频在互联网流量中占据主导地位，视频编码技术的突破成为迫切需求。传统基于率失真理论的编码方法未能充分考虑人类视觉系统的非线性感知特性，导致编码效率与主观质量之间存在脱节。在此背景下，南加州大学媒体通信实验室联合Netflix、华为、三星等工业界伙伴，于2016年秋季构建了VideoSet数据集。该数据集基于恰可察觉差异（JND）测量原理，旨在通过大规模主观实验揭示人类对压缩视频质量的离散感知规律，为数据驱动的感知编码研究奠定基础。VideoSet包含220段5秒视频序列，覆盖四种分辨率，每段视频通过H.264编码生成52个量化参数版本，并由30余名受试者标注前三个JND点，共计45760个视频片段。该数据集的发布推动了视频编码从传统客观指标向主观感知质量建模的范式转变，对新一代编码标准制定具有深远影响。

当前挑战

VideoSet致力于解决视频质量评估领域的核心挑战：如何建立符合人类视觉感知的压缩视频质量度量标准。传统峰值信噪比等客观指标与主观体验相关性较弱，而JND测量需克服个体感知差异大、测试成本高昂等难题。在构建过程中，研究团队面临多重挑战：首先，主观测试需在六所高校的58个站点协调进行，确保测试环境一致性与数据可比性；其次，JND搜索算法需平衡效率与鲁棒性，避免因受试者决策偏差导致数据失真；此外，数据后处理需通过异常值检测（如Grubbs检验）和受试者可靠性分析（如z分数一致性检验）剔除噪声，保证样本服从正态分布。这些挑战的应对为大规模感知质量数据集的构建提供了方法论参考。

常用场景

经典使用场景

在视频编码与质量评估领域，VideoSet数据集为研究者提供了基于恰可察觉差异（JND）的大规模主观测试数据。该数据集通过系统化采集人类视觉系统对压缩视频的感知阈值，成为验证和优化感知视频编码算法的基准工具。其经典应用场景包括构建感知质量预测模型，例如利用机器学习方法从视频内容特征中推断JND点，从而推动数据驱动的编码策略发展。

解决学术问题

VideoSet数据集解决了传统视频质量评估中客观指标（如峰值信噪比）与主观感知脱节的核心问题。通过引入JND测量，它将人类视觉的非线性感知过程量化，为视频编码研究提供了统计意义上的感知质量基准。这一突破使得研究者能够探索感知率失真优化，挑战了基于香农理论的连续凸函数假设，推动了视频编码从信号保真度向用户体验质量的范式转变。

实际应用

在实际应用中，VideoSet数据集为流媒体服务和视频编码标准化提供了关键支撑。基于其JND数据衍生的满意用户比率曲线，使平台能够根据目标用户群体的感知阈值自适应选择量化参数，实现感知无损压缩。这不仅优化了带宽分配与存储效率，还提升了终端观看体验，为Netflix、华为等工业伙伴的编码器优化与质量控制提供了实证依据。

数据集最近研究