eugenesiow/Div2k

Name: eugenesiow/Div2k
Creator: eugenesiow
Published: 2022-10-21 04:01:10
License: 暂无描述

Hugging Face2022-10-21 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/eugenesiow/Div2k

下载链接

链接失效反馈

官方服务：

资源简介：

Div2k数据集是一个用于图像超分辨率任务的RGB图像数据集，包含高分辨率（HR）和低分辨率（LR）的图像。数据集分为训练集和验证集，训练集包含800张图像，验证集包含100张图像。这些图像来源于互联网，涵盖了多样化的内容，包括人物、手工制品、环境、动植物和自然景观等。数据集的使用仅限于学术研究目的，版权归原始所有者所有。

The Div2k dataset is an RGB image dataset for image super-resolution tasks, containing both high-resolution (HR) and low-resolution (LR) images. It is split into a training set and a validation set, with 800 images in the training set and 100 images in the validation set. These images are sourced from the Internet, covering diverse content including people, handmade artifacts, environments, animals and plants, natural landscapes, and more. Usage of this dataset is restricted to academic research purposes only, and the copyright belongs to the original owners.

提供机构：

eugenesiow

原始信息汇总

数据集概述

数据集名称

名称: DIV2K
别名: Div2k

数据集描述

摘要: DIV2K是一个包含RGB图像（2K分辨率高质量图像）的数据集，内容多样。
任务: 主要用于image-super-resolution任务的训练和评估。
结构: 数据集分为训练和验证两部分，包含高分辨率和低分辨率图像。

数据集结构

数据实例: 每个实例包含高分辨率（hr）和低分辨率（lr）图像的路径。
数据字段:
- hr: 高分辨率图像路径，类型为string。
- lr: 低分辨率图像路径，类型为string。
数据分割:
- train: 800张图像
- validation: 100张图像

数据集创建

来源数据: 数据集由作者从互联网手动搜集的1000张彩色RGB图像构成，特别注意了图像质量、来源多样性、内容和版权。
数据处理: 所有图像均为2K分辨率，经过统一工具处理，确保高质量和低噪声。

使用注意事项

版权: 所有图像版权属于原始所有者，如有需要，作者将立即从数据集中移除相关图像。
使用许可: 该数据集仅供学术研究使用。

搜集汇总

数据集介绍

构建方式

DIV2K数据集源自NTIRE 2017超分辨率挑战赛，由Eirikur Agustsson和Radu Timofte等人构建。其图像采集自多个高质量摄影网站，如Pexels，避开了Flickr等具有版权限制的平台，确保了内容的合法性与多样性。所有图像均为2K分辨率，在至少一个轴上拥有2000像素，并经过统一处理，裁剪为12的倍数以适配常见的×2、×3和×4放大因子。数据集包含800张训练图像和100张验证图像，通过随机划分并平衡视觉内容、熵值、每像素比特数及CORNIA质量分数等指标精心筛选而成。低分辨率图像通过双三次下采样等退化方式生成，提供了bicubic、unknown和realistic等多种退化类型，覆盖从简单到复杂的超分辨率任务场景。

使用方法

使用DIV2K数据集时，推荐通过HuggingFace的datasets库结合super-image库进行加载与评估。首先安装依赖包，如pip install datasets super-image，然后使用load_dataset函数指定配置，例如load_dataset('eugenesiow/Div2k', 'bicubic_x2', split='validation')，即可获取高分辨率（hr）和低分辨率（lr）图像路径。数据实例包含两个字符串字段，分别指向HR和LR的PNG文件。对于模型评估，可将数据集包装为EvalDataset对象，并调用EvalMetrics的evaluate方法，传入预训练的超分辨率模型（如EdsrModel）进行性能测试。数据集支持多种退化配置的选择，用户可根据研究需求灵活切换，同时官方提供了基于super-image库的排行榜，便于对比不同模型的超分辨率效果。

背景与挑战

背景概述

在计算机视觉领域，单图像超分辨率（Single Image Super-Resolution, SISR）是一项旨在从低分辨率输入中重建高分辨率图像的核心任务，其应用广泛涉及医学成像、卫星遥感和视频增强等领域。为应对该领域对高质量、多样化基准数据集的迫切需求，Eirikur Agustsson 与 Radu Timofte 于2017年发布了DIV2K数据集，该数据集源自NTIRE 2017超分辨率挑战赛，由瑞士苏黎世联邦理工学院（ETH Zurich）主导创建。DIV2K包含800张训练图像与100张验证图像，全部为2K分辨率的高质量RGB图像，内容涵盖人物、城市景观、自然风光及水下场景等广泛类别。其独特之处在于提供了通过双三次降采样和未知退化方式生成的多种缩放因子（×2、×3、×4、×8）的低分辨率版本，为超分辨率模型的训练与评估奠定了标准化基础。该数据集已成为SISR领域最权威的基准之一，被广泛应用于EDSR、RCAN等经典模型的性能比较，极大推动了图像超分辨率技术的发展。

当前挑战

DIV2K数据集所解决的领域问题主要围绕图像超分辨率重建中的退化模型不匹配与泛化能力不足。实际应用中，低分辨率图像往往由未知且复杂的退化过程（如模糊、噪声、压缩伪影）生成，而传统数据集仅模拟双三次降采样，导致模型在真实场景下性能骤降。为此，DIV2K引入了未知退化（unknown）和真实世界退化（realistic_mild、realistic_difficult、realistic_wild）等子集，以挑战模型对多样化退化模式的适应能力。在数据集构建过程中，研究人员面临多重挑战：首先，需从互联网海量图片中筛选出2K分辨率且美学质量高、噪声与模糊极少的图像，同时规避版权限制；其次，通过计算熵、每像素比特数及CORNIA质量分数等指标，对1000张候选图进行随机分区，确保800张训练集与100张验证集在视觉内容与统计特性上达成均衡；此外，还需协调多种降采样因子（如×2至×8）的生成流程，并保证高/低分辨率图像对的严格对齐，这些步骤共同构成了数据集构建的核心技术难点。

常用场景

经典使用场景

DIV2K数据集在图像超分辨率领域占据着举足轻重的地位，其经典用途在于为单幅图像超分辨率任务提供标准化的训练与评估基准。该数据集包含800张高分辨率训练图像与100张验证图像，通过双三次下采样等退化方式生成对应的低分辨率图像，覆盖了×2、×3、×4及×8等多种放大倍数。研究者可基于此数据集训练深度神经网络模型，学习从低分辨率到高分辨率图像的映射关系，并在统一的验证集上客观比较不同算法的性能优劣。这种标准化的评估范式极大地推动了超分辨率算法的量化比较与迭代优化。

解决学术问题

该数据集有效解决了超分辨率研究中长期存在的基准不统一与数据质量参差不齐的学术困境。在DIV2K出现之前，研究者常使用Set5、Set14等小规模数据集，其图像数量有限且分辨率较低，难以全面评估模型在复杂场景下的泛化能力。DIV2K通过提供2K分辨率的高质量图像，涵盖城市、自然、人物等多样的视觉内容，使得模型能够学习到更丰富的纹理细节与边缘信息。这一数据集的提出为NTIRE 2017挑战赛奠定了坚实基础，促进了超分辨率领域从传统插值方法向深度学习范式的重大转变，同时也为后续的盲超分辨率、真实世界超分辨率等子方向提供了重要的数据支撑。

实际应用

在实际应用层面，DIV2K数据集训练出的超分辨率模型已广泛渗透至多个重要领域。在智能手机摄影中，该技术被用于提升数字变焦后的图像清晰度，使得用户能够在保持画质的同时实现更远距离的拍摄。在医学影像分析中，超分辨率技术帮助医生从低分辨率的CT或MRI图像中恢复更精细的解剖结构，从而提高诊断的准确性。此外，在卫星遥感、视频监控与图像修复等场景中，基于DIV2K训练的模型能够有效增强低质量输入图像的视觉保真度，为后续的目标检测、语义分割等高级视觉任务提供更优质的输入。

数据集最近研究