CVQAD
收藏MSU压缩数据集概述
数据集简介
LEHA-CVQAD数据集用于评估全参考和无参考视频质量指标。此处共享了整个压缩伪影数据集(6,240个视频中的1,962个)的开放部分。隐藏部分仅对基准测试支持人员开放,用于测试指标性能。所有视频主要为FullHD分辨率、YUV420格式,时长10-15秒。帧率值为24、25、30、39、50和60。
主观质量分数也以CSV文件形式提供。分数越高,质量越好。要了解更多关于我们基准测试主观质量评估过程的信息,可以访问Subjectify.us的FAQ部分。
关于数据集和基准测试方法的更详细描述可以在论文TODO中找到。
LEHA-CVQAD数据集上100多个指标的排行榜:MSU视频质量指标基准页面。
数据集结构
-
Subjective_scores_and_videos_info.csv:包含每个压缩视频的主观分数(MOS、Bradley-Terry、ELO)。每个失真视频除了主观质量外,还具有以下特征:
- 原始(无损)视频的名称
- 用于编码的编解码器
- 编解码器标准(avc、hevc、vvc、av1等)
- 目标比特率或crf
- 比特率范围(高、中、低)
- 原始视频分辨率
- 原始视频帧率
-
Metrics_scores.csv:包含100多个VQA指标在数据集上的值,可用于计算VQA指标与主观分数的相关性。
-
Compressed_and_GT_videos:包含59个文件夹,每个文件夹包括1个参考视频(GT,用于测试全参考指标)和许多失真视频(压缩视频),按编码预设分组:
- 每个失真视频的命名模式:
{视频名称}/{编码预设}/{编解码器名称}_{crf或比特率}.mp4 - 每个参考视频的命名模式:
{视频名称}/GT.mp4
- 每个失真视频的命名模式:
相关性计算
针对MOS分数
仅应用于计算指标分数与MOS主观分数之间的相关性。 对整个MOS主观分数列表和指标分数列表应用单一相关系数。
针对BT和ELO分数
仅应用于计算指标分数与BT和ELO主观分数之间的相关性。 数据集中有59个不同的原始(无损)视频以及多个编码预设。请注意:需要在所有视频和预设上分别计算相关系数(SRCC、KRCC等)。因此,要获得整个数据集的单一相关性,应使用Fisher Z变换,按组大小加权平均组相关性,步骤如下:
- 遍历59个原始视频,对每个视频计算相关系数,次数等于当前视频的唯一预设数量。
- 对每个相关系数值使用反双曲正切(artanh)变换,将可能的无穷大值替换为artanh(0.99)。
- 对得到的值应用加权算术平均。
- 计算加权平均值的双曲正切(tanh),取其绝对值,并将0.99替换为1。
- 得到的值代表你的方法分数与数据集上主观分数之间的相关性。
用于计算指标与主观分数(BT和ELO)相关性的脚本在GitHub仓库中提供:https://github.com/msu-video-group/MSU_VQM_Compression_Benchmark
编码与解码
-
编码视频使用的命令:
ffmpeg −f rawvideo −vcodec rawvideo −s {width}x{height} −r {FPS} −pix_fmt yuv420p −i {video name}.yuv −c:v libx265 −x265−params "lossless =1:qp=0" −vsync 0 {video name}.mp4
-
将视频解码回YUV格式的命令:
ffmpeg -i {video name}.mp4 -pix_fmt yuv420p -vcodec rawvideo -f rawvideo {video name}.yuv
-
将编码视频转换为PNG图像集的命令:
ffmpeg -i {video name}.mp4 {frames dir}/frame_%05d.png
支持与维护
CMC MSU图形与媒体实验室托管该数据集。处理编解码器和视频质量评估方法的团队负责维护。该论文的作者支持视频质量指标基准测试。如有关于LEHA-CVQAD使用的任何问题,请通过vqa@videoprocessing.ai联系我们。




