five

DIV2K|图像超分辨率数据集|图像处理数据集

收藏
github2024-05-07 更新2024-05-31 收录
图像超分辨率
图像处理
下载链接:
https://github.com/QingtangDing/DCSR
下载链接
链接失效反馈
资源简介:
用于单图像超分辨率的高分辨率图像数据集,用于数据集凝练过程中的图像补丁裁剪和处理。

A high-resolution image dataset for single-image super-resolution, utilized for image patch cropping and processing during the dataset distillation process.
创建时间:
2023-09-28
原始信息汇总

数据集概述

数据集名称

DIV2K

数据集来源

DIV2K

数据集准备步骤

  1. 下载DIV2K数据集
  2. 裁剪高分辨率图像:将HR图像裁剪成图像补丁,存放于data_path/DIV2K/HR

数据集处理策略

  1. 基于纹理复杂度的凝练策略

    • 测量图像补丁的复杂度: bash python texture_complexity_measurement.py

    • 移除低复杂度图像补丁: bash python remove_low_complexity.py

  2. 基于纹理多样性的凝练策略

    • 图像补丁聚类: bash python cluster_patches.py

    • 移除每个聚类中纹理相似的图像补丁: bash python sample_patches.py

性能评估

  1. 训练超分辨率网络:使用凝练后的数据集训练模型。 bash python main.py --model EDSR --scale 2 --save DCSR_X2 --patch_size 96 --batch_size 16

  2. 测试模型性能:使用基准数据集(如Set5, Set14等)进行测试。 bash python main.py --model EDSR --data_test Set5 --scale 2 --test_only

AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建DIV2K数据集时,首先从官方来源下载高分辨率(HR)图像,随后将这些图像裁剪成小块,存储在指定路径下。为了提升数据集的质量,采用了基于纹理复杂性和多样性的双重浓缩策略。通过测量图像块的复杂性并移除低复杂度块,以及基于纹理特征进行聚类并剔除相似纹理块,最终形成了一个高效且多样化的数据集。
特点
DIV2K数据集以其高分辨率图像和经过精心筛选的图像块著称,这些图像块不仅保留了原始图像的细节,还通过复杂的浓缩策略去除了冗余信息,从而提升了数据集的实用性和训练效率。此外,该数据集的多样性确保了在单图像超分辨率任务中的广泛适用性。
使用方法
使用DIV2K数据集时,首先需下载并准备数据,随后可以通过提供的脚本进行纹理复杂性测量和图像块的筛选。在训练超分辨率网络时,可直接调用main.py脚本,指定模型和参数进行训练。测试阶段,需准备测试数据集,并使用相同的脚本进行性能评估,确保模型在不同数据集上的表现。
背景与挑战
背景概述
DIV2K数据集,由ETH Zurich的计算机视觉实验室创建,专注于单图像超分辨率(Single Image Super-Resolution, SISR)领域。该数据集的构建旨在解决图像处理中一个核心问题:如何从低分辨率图像中恢复出高分辨率细节。DIV2K的发布时间为2023年,主要研究人员包括Ding Qingtang、Liang Zhengyu、Wang Longguang、Wang Yingqian和Yang Jungang。其核心研究问题是如何通过层次化数据集浓缩技术,提升超分辨率模型的性能。DIV2K的引入对SISR领域产生了深远影响,为研究人员提供了一个高质量的基准数据集,推动了该领域的技术进步。
当前挑战
DIV2K数据集在构建过程中面临多项挑战。首先,如何从原始高分辨率(HR)图像中提取有效的图像块,以确保数据集的多样性和代表性,是一个关键问题。其次,数据集浓缩过程中,如何有效测量和移除低复杂度的图像块,以减少冗余信息,同时保持图像的纹理多样性,是另一大挑战。此外,在实际应用中,如何确保浓缩后的数据集能够有效训练超分辨率模型,并在不同测试集上保持稳定的性能,也是需要解决的问题。这些挑战不仅涉及数据处理技术,还要求对图像特征有深入的理解和分析。
常用场景
经典使用场景
在图像处理领域,DIV2K数据集常用于单图像超分辨率(Single Image Super-Resolution, SISR)任务。该数据集通过提供高分辨率(HR)图像及其对应的低分辨率(LR)图像,为研究人员提供了一个标准化的测试平台。经典的使用场景包括训练和验证超分辨率算法,如EDSR(Enhanced Deep Super-Resolution)模型,以提升图像的清晰度和细节还原能力。
解决学术问题
DIV2K数据集解决了图像超分辨率领域中数据稀缺和多样性不足的问题。通过提供高质量的HR图像和相应的LR图像,该数据集为研究人员提供了一个丰富的资源库,有助于推动超分辨率算法的发展。其意义在于,通过标准化的数据集,研究人员可以更公平地比较不同算法的性能,从而加速学术研究的进展。
衍生相关工作
基于DIV2K数据集,许多经典工作得以展开。例如,EDSR(Enhanced Deep Super-Resolution)模型通过利用该数据集进行训练,显著提升了图像超分辨率的效果。此外,ClassSR(Class-Aware Super-Resolution)模型也利用DIV2K数据集进行分类和超分辨率处理,进一步优化了图像恢复的质量。这些工作不仅推动了超分辨率技术的发展,也为其他图像处理任务提供了宝贵的参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录