SRITM-4K

Name: SRITM-4K
Creator: 南开大学统计与数据科学学院
Published: 2023-09-07 16:19:44
License: 暂无描述

arXiv2023-09-07 更新2024-06-21 收录

下载链接：

https://github.com/CS-GangXu/FDAN

下载链接

链接失效反馈

官方服务：

资源简介：

SRITM-4K数据集由南开大学统计与数据科学学院创建，包含5200张4K分辨率的高动态范围（HDR）和标准动态范围（SDR）图像对，用于联合超分辨率和逆色调映射（SR-ITM）任务。数据集涵盖多种场景，支持模型训练和评估。创建过程中，从30对HDR和SDR视频中均匀采样图像，并使用双三次插值生成低分辨率SDR图像。该数据集旨在解决现有数据集规模小、场景单一的问题，推动SR-ITM技术的发展。

SRITM-4K dataset was developed by the College of Statistics and Data Science, Nankai University. It contains 5200 pairs of 4K-resolution high dynamic range (HDR) and standard dynamic range (SDR) image pairs, targeting the joint super-resolution and inverse tone mapping (SR-ITM) task. The dataset covers diverse scenarios, supporting both model training and evaluation. During its construction, images were uniformly sampled from 30 pairs of HDR and SDR videos, and low-resolution SDR images were generated via bicubic interpolation. This dataset aims to address the limitations of small scale and limited scene diversity in existing datasets, so as to promote the advancement of SR-ITM technologies.

提供机构：

南开大学统计与数据科学学院

创建时间：

2022-07-07

搜集汇总

数据集介绍

构建方式

在超分辨率与逆色调映射联合任务的研究中，数据集的规模与质量直接影响模型的泛化能力。SRITM-4K数据集的构建旨在弥补现有数据规模不足的缺陷，其采集过程系统而严谨。研究团队从YouTube平台精选了30对符合Rec.709标准的全高清标准动态范围视频与符合Rec.2100标准的4K高动态范围视频作为原始素材。通过对这30对视频进行均匀采样，最终构建了包含5,000对训练图像与200对测试图像的大规模数据集。所有高分辨率图像均保持3840×2160的4K分辨率，并通过双三次插值下采样生成多种尺度的低分辨率输入，以支持×2至×16不同倍率的超分辨率任务。该构建流程确保了数据在场景多样性、分辨率与动态范围方面的完备性。

使用方法

该数据集在联合超分辨率与逆色调映射模型的训练与评估中具有明确的使用范式。在训练阶段，研究者通常从高分辨率高动态范围真值图像中随机裁剪固定尺寸的图像块，并在对应位置从标准动态范围图像中经下采样获得低分辨率输入，以此构建训练样本对。数据增强技术如水平翻转与随机旋转常被应用于提升模型鲁棒性。评估时，则直接使用完整的测试集图像对，通过计算PSNR、SSIM、HDR-VDP-3及PU系列指标，全面衡量模型在空间细节重建与动态范围扩展两方面的性能。数据集支持多种上采样倍率的任务设定，为不同应用需求下的模型比较提供了统一平台。

背景与挑战

背景概述

随着超高清（UHD）与高动态范围（HDR）显示技术的快速发展，将广泛存在的全高清标准动态范围（FHD-SDR）图像转换为UHD-HDR格式成为计算机视觉领域的重要课题。SRITM-4K数据集由南开大学、中国科学院自动化研究所等机构的研究团队于2023年构建，旨在为联合超分辨率与逆色调映射任务提供大规模、多样化的基准数据。该数据集包含从30对视频中提取的5,200张4K分辨率图像，覆盖丰富场景，有效解决了以往数据规模小、感受野受限的问题，显著推动了联合SR-ITM模型的训练与评估。

当前挑战

在联合超分辨率与逆色调映射领域，核心挑战在于如何同时提升图像的空间分辨率与动态范围，避免两阶段方法带来的计算负担与信息损失。SRITM-4K数据集的构建过程亦面临多重困难：需从海量视频资源中筛选高质量、多样化的HDR-SDR图像对，并确保其色彩空间与分辨率符合标准；同时，数据预处理涉及复杂的下采样与对齐操作，以生成多尺度低分辨率输入，保证训练样本的准确性与一致性。

常用场景

经典使用场景

在超高清高动态范围显示技术领域，SRITM-4K数据集为联合超分辨率与逆色调映射任务提供了关键基准。该数据集通过提供大规模、高分辨率的训练与测试图像对，使得深度学习模型能够在多样化场景中学习从低分辨率标准动态范围图像到高分辨率高动态范围图像的端到端映射。其经典应用场景集中于训练和评估能够同时提升图像空间分辨率与动态范围的先进神经网络，如特征分解聚合网络，以推动超高清高动态范围内容生成技术的发展。

解决学术问题

SRITM-4K数据集有效解决了联合超分辨率与逆色调映射研究中的若干核心学术问题。首先，它弥补了先前数据集规模小、场景单一的缺陷，为复杂深度学习模型提供了充足的训练样本与多样化的测试环境，避免了模型因训练数据不足而产生的过拟合与泛化能力弱的问题。其次，数据集的高分辨率特性使得模型能够获得更大的感受野，从而更好地捕捉图像中的全局结构与局部细节，提升了模型在处理真实世界高分辨率图像时的重建质量与鲁棒性。

实际应用

该数据集的实际应用价值主要体现在推动超高清高动态范围显示技术的普及与内容生态建设。基于SRITM-4K训练的先进模型，能够将海量现有的全高清标准动态范围视频与图像资源，高效转换为符合超高清高动态范围显示标准的内容，从而缓解高质量内容匮乏对高端显示设备推广的制约。此项技术可广泛应用于广播电视、流媒体服务、数字影院以及虚拟现实等领域，为用户带来更沉浸、更真实的视觉体验。

数据集最近研究