HEVC-CU-depths-dataset

github2024-05-07 更新2024-05-31 收录

下载链接：

https://github.com/wolverinn/HEVC-CU-depths-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含用于HEVC内部预测的Coding Unit图像文件及其对应的深度信息。每个I帧被分为64x64的Coding Tree Units (CTU)，每个CTU有一个16x16的深度预测矩阵，矩阵元素表示CTU中4x4块的深度0/1/2/3。数据集分为训练、验证和测试三个部分，包含图像文件和对应的标签文件。

This dataset comprises Coding Unit image files utilized for HEVC intra prediction, along with their corresponding depth information. Each I-frame is segmented into 64x64 Coding Tree Units (CTUs), with each CTU featuring a 16x16 depth prediction matrix. The elements of this matrix denote the depth levels (0/1/2/3) of 4x4 blocks within the CTU. The dataset is partitioned into training, validation, and testing subsets, encompassing both image files and their associated label files.

创建时间：

2019-10-26

原始信息汇总

数据集概述

名称: HEVC-CU-depths-dataset

内容: 该数据集包含HEVC（高效视频编码）内部预测的编码单元（CU）图像文件及其对应的深度信息。每个I帧被划分为64x64的编码树单元（CTU），每个CTU的深度预测由一个16x16的矩阵表示，矩阵元素为0、1、2或3，代表CTU中4x4块的深度0/1/2/3。

结构:

图像文件: 每个图像大小不一，是从视频中提取的一帧。可被分割为多个64x64或32x32的图像块。
标签: 标签存储在pkl文件夹中，每个64x64的CTU对应一个长度为16的Python列表，代表16个16x16图像块的深度信息。

数据集划分:

训练集: 约110,000张图像。
验证集: 约40,000张图像。
测试集: 未提供具体数量。

文件命名规则: 图像文件名如v_0_42_104_.jpg，表示v_视频编号_帧编号_CTU编号_.jpg。对应的.pkl文件名使用视频编号，如v_0.pkl。

标签获取: 通过Python字典索引获取特定64x64 CTU的标签，例如label_vector = video_dict["42"]["104"]，返回一个长度为16的Python列表。

使用示例: 提供了一个PyTorch项目中的加载示例，位于load_example.py，用于加载32x32图像块并预测4个对应的标签。

深度学习应用: 数据集适用于使用深度学习方法预测64x64 CTU的最佳CU深度，参考文献包括：

自定义数据集: 提供源代码gen_dataset.py以生成自定义数据集，建议下载整个Advanced文件夹。使用YUV文件作为输入，通过FFmpeg提取帧，并使用HEVC编码器输出所需的深度信息。

搜集汇总

数据集介绍

构建方式

HEVC-CU-depths-dataset的构建基于HEVC（高效视频编码）标准中的帧内预测过程。该数据集通过将视频帧分割为64x64的编码树单元（CTU），并为每个CTU生成一个16x16的深度矩阵，矩阵中的每个元素表示4x4块的深度级别（0到3）。数据集的构建过程包括从YUV文件中提取帧，使用HEVC编码器生成深度信息，并将这些信息存储为图像文件和对应的标签文件。标签文件以Python的pickle格式存储，每个CTU的标签是一个长度为16的列表，代表16个16x16块的深度信息。

特点

HEVC-CU-depths-dataset的主要特点在于其精细的深度信息表示和高效的标签存储方式。每个CTU的深度信息被压缩为一个16维的向量，而非传统的16x16矩阵，从而减少了冗余信息。此外，数据集被划分为训练、验证和测试集，分别包含约110K、40K和未知数量的图像，便于模型训练和评估。图像文件和标签文件通过视频编号和帧编号进行关联，确保了数据的完整性和可追溯性。

使用方法

使用HEVC-CU-depths-dataset时，首先需要解压缩图像和标签文件。图像文件可以进一步分割为64x64或32x32的CTU块，每个CTU块对应一个16维的标签向量。通过视频编号和帧编号，用户可以快速定位并加载所需的标签文件。数据集提供了PyTorch加载示例，展示了如何在深度学习项目中使用该数据集。此外，用户还可以参考相关文献，如基于深度卷积神经网络的HEVC复杂度降低方法，来了解如何在HEVC帧内预测中应用该数据集。

背景与挑战

背景概述

HEVC-CU-depths-dataset是由研究人员创建的一个专注于高效视频编码（HEVC）中编码单元（CU）深度预测的数据集。该数据集的核心研究问题是如何通过深度学习方法预测HEVC编码中的CU深度，从而减少编码过程中的计算复杂度。HEVC编码过程中，每个I帧被划分为64x64的编码树单元（CTU），每个CTU的深度预测是一个16x16的矩阵，矩阵中的元素表示4x4块的深度级别。该数据集的创建旨在通过提供图像文件及其对应的深度标签，支持研究人员开发更高效的HEVC编码算法，从而推动视频压缩技术的发展。

当前挑战

HEVC-CU-depths-dataset在构建过程中面临多个挑战。首先，数据集的构建需要从YUV文件中提取视频帧，并将其分割为64x64的CTU，这一过程涉及大量的数据处理和存储。其次，深度标签的生成需要通过HEVC编码器进行复杂的计算，如何高效地提取和处理这些标签是一个技术难点。此外，数据集的规模较大，训练集包含约110K图像，验证集包含约40K图像，如何在有限的计算资源下高效地处理和利用这些数据也是一个挑战。最后，如何确保深度学习模型能够准确预测CU深度，从而有效减少HEVC编码的复杂度，是该数据集在实际应用中的主要挑战。

常用场景

经典使用场景

HEVC-CU-depths-dataset 在高效视频编码（HEVC）领域中，主要用于预测编码单元（CU）的深度信息。该数据集通过提供图像文件及其对应的深度标签，使得研究人员能够训练深度学习模型，以快速且准确地预测HEVC编码过程中的CU深度。这种预测能力显著减少了编码器的计算复杂度，特别是在处理64x64编码树单元（CTU）时，模型能够直接输出16x16的深度矩阵，从而优化编码效率。

实际应用

在实际应用中，HEVC-CU-depths-dataset 可广泛应用于视频压缩、实时视频传输和视频存储优化等领域。通过使用该数据集训练的模型，视频编码器能够在保证视频质量的前提下，显著降低编码复杂度和时间，从而提升整体系统的性能。例如，在视频会议、流媒体服务和视频监控系统中，快速且高效的编码技术能够为用户提供更流畅的观看体验，同时减少带宽和存储资源的消耗。

衍生相关工作

基于HEVC-CU-depths-dataset，许多研究工作得以展开，进一步推动了HEVC编码技术的发展。例如，有研究者提出了基于深度卷积神经网络（CNN）的复杂度降低方法，通过训练模型直接预测CU深度，从而优化编码效率。此外，还有研究探讨了如何利用神经网络进行快速CU深度决策，进一步提升了编码速度和准确性。这些衍生工作不仅验证了数据集的有效性，还为HEVC编码技术的未来发展提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集