five

HEVC-CU-depths-dataset

收藏
github2024-05-07 更新2024-05-31 收录
下载链接:
https://github.com/wolverinn/HEVC-CU-depths-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于HEVC内部预测的Coding Unit图像文件及其对应的深度信息。每个I帧被分为64x64的Coding Tree Units (CTU),每个CTU有一个16x16的深度预测矩阵,矩阵元素表示CTU中4x4块的深度0/1/2/3。数据集分为训练、验证和测试三个部分,包含图像文件和对应的标签文件。

This dataset comprises Coding Unit image files utilized for HEVC intra prediction, along with their corresponding depth information. Each I-frame is segmented into 64x64 Coding Tree Units (CTUs), with each CTU featuring a 16x16 depth prediction matrix. The elements of this matrix denote the depth levels (0/1/2/3) of 4x4 blocks within the CTU. The dataset is partitioned into training, validation, and testing subsets, encompassing both image files and their associated label files.
创建时间:
2019-10-26
原始信息汇总

数据集概述

名称: HEVC-CU-depths-dataset

内容: 该数据集包含HEVC(高效视频编码)内部预测的编码单元(CU)图像文件及其对应的深度信息。每个I帧被划分为64x64的编码树单元(CTU),每个CTU的深度预测由一个16x16的矩阵表示,矩阵元素为0、1、2或3,代表CTU中4x4块的深度0/1/2/3。

结构:

  • 图像文件: 每个图像大小不一,是从视频中提取的一帧。可被分割为多个64x64或32x32的图像块。
  • 标签: 标签存储在pkl文件夹中,每个64x64的CTU对应一个长度为16的Python列表,代表16个16x16图像块的深度信息。

数据集划分:

  • 训练集: 约110,000张图像。
  • 验证集: 约40,000张图像。
  • 测试集: 未提供具体数量。

文件命名规则: 图像文件名如v_0_42_104_.jpg,表示v_视频编号_帧编号_CTU编号_.jpg。对应的.pkl文件名使用视频编号,如v_0.pkl。

标签获取: 通过Python字典索引获取特定64x64 CTU的标签,例如label_vector = video_dict["42"]["104"],返回一个长度为16的Python列表。

使用示例: 提供了一个PyTorch项目中的加载示例,位于load_example.py,用于加载32x32图像块并预测4个对应的标签。

深度学习应用: 数据集适用于使用深度学习方法预测64x64 CTU的最佳CU深度,参考文献包括:

自定义数据集: 提供源代码gen_dataset.py以生成自定义数据集,建议下载整个Advanced文件夹。使用YUV文件作为输入,通过FFmpeg提取帧,并使用HEVC编码器输出所需的深度信息。

搜集汇总
数据集介绍
main_image_url
构建方式
HEVC-CU-depths-dataset的构建基于HEVC(高效视频编码)标准中的帧内预测过程。该数据集通过将视频帧分割为64x64的编码树单元(CTU),并为每个CTU生成一个16x16的深度矩阵,矩阵中的每个元素表示4x4块的深度级别(0到3)。数据集的构建过程包括从YUV文件中提取帧,使用HEVC编码器生成深度信息,并将这些信息存储为图像文件和对应的标签文件。标签文件以Python的pickle格式存储,每个CTU的标签是一个长度为16的列表,代表16个16x16块的深度信息。
特点
HEVC-CU-depths-dataset的主要特点在于其精细的深度信息表示和高效的标签存储方式。每个CTU的深度信息被压缩为一个16维的向量,而非传统的16x16矩阵,从而减少了冗余信息。此外,数据集被划分为训练、验证和测试集,分别包含约110K、40K和未知数量的图像,便于模型训练和评估。图像文件和标签文件通过视频编号和帧编号进行关联,确保了数据的完整性和可追溯性。
使用方法
使用HEVC-CU-depths-dataset时,首先需要解压缩图像和标签文件。图像文件可以进一步分割为64x64或32x32的CTU块,每个CTU块对应一个16维的标签向量。通过视频编号和帧编号,用户可以快速定位并加载所需的标签文件。数据集提供了PyTorch加载示例,展示了如何在深度学习项目中使用该数据集。此外,用户还可以参考相关文献,如基于深度卷积神经网络的HEVC复杂度降低方法,来了解如何在HEVC帧内预测中应用该数据集。
背景与挑战
背景概述
HEVC-CU-depths-dataset是由研究人员创建的一个专注于高效视频编码(HEVC)中编码单元(CU)深度预测的数据集。该数据集的核心研究问题是如何通过深度学习方法预测HEVC编码中的CU深度,从而减少编码过程中的计算复杂度。HEVC编码过程中,每个I帧被划分为64x64的编码树单元(CTU),每个CTU的深度预测是一个16x16的矩阵,矩阵中的元素表示4x4块的深度级别。该数据集的创建旨在通过提供图像文件及其对应的深度标签,支持研究人员开发更高效的HEVC编码算法,从而推动视频压缩技术的发展。
当前挑战
HEVC-CU-depths-dataset在构建过程中面临多个挑战。首先,数据集的构建需要从YUV文件中提取视频帧,并将其分割为64x64的CTU,这一过程涉及大量的数据处理和存储。其次,深度标签的生成需要通过HEVC编码器进行复杂的计算,如何高效地提取和处理这些标签是一个技术难点。此外,数据集的规模较大,训练集包含约110K图像,验证集包含约40K图像,如何在有限的计算资源下高效地处理和利用这些数据也是一个挑战。最后,如何确保深度学习模型能够准确预测CU深度,从而有效减少HEVC编码的复杂度,是该数据集在实际应用中的主要挑战。
常用场景
经典使用场景
HEVC-CU-depths-dataset 在高效视频编码(HEVC)领域中,主要用于预测编码单元(CU)的深度信息。该数据集通过提供图像文件及其对应的深度标签,使得研究人员能够训练深度学习模型,以快速且准确地预测HEVC编码过程中的CU深度。这种预测能力显著减少了编码器的计算复杂度,特别是在处理64x64编码树单元(CTU)时,模型能够直接输出16x16的深度矩阵,从而优化编码效率。
实际应用
在实际应用中,HEVC-CU-depths-dataset 可广泛应用于视频压缩、实时视频传输和视频存储优化等领域。通过使用该数据集训练的模型,视频编码器能够在保证视频质量的前提下,显著降低编码复杂度和时间,从而提升整体系统的性能。例如,在视频会议、流媒体服务和视频监控系统中,快速且高效的编码技术能够为用户提供更流畅的观看体验,同时减少带宽和存储资源的消耗。
衍生相关工作
基于HEVC-CU-depths-dataset,许多研究工作得以展开,进一步推动了HEVC编码技术的发展。例如,有研究者提出了基于深度卷积神经网络(CNN)的复杂度降低方法,通过训练模型直接预测CU深度,从而优化编码效率。此外,还有研究探讨了如何利用神经网络进行快速CU深度决策,进一步提升了编码速度和准确性。这些衍生工作不仅验证了数据集的有效性,还为HEVC编码技术的未来发展提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作