five

PSR4K

收藏
arXiv2025-10-15 更新2025-10-16 收录
下载链接:
https://arxiv.org/html/2510.12765v1
下载链接
链接失效反馈
官方服务:
资源简介:
PSR4K数据集由500张分辨率为960×540像素的低分辨率图像组成,这些图像通过多种降质类型进行降质,但没有提供原始的高质量图像。该数据集旨在反映实际部署条件,并作为多样性和挑战性的基准。数据集被分为十个类别:动物、建筑、艺术、食物、自然、物体、肖像、运动、文本和城市场景。每个类别都应用了五种不同的降质,包括各种下采样方法、模糊和JPEG压缩。

The PSR4K dataset consists of 500 low-resolution images with a resolution of 960×540 pixels. These images are degraded via various degradation types, while no original high-quality images are provided. This dataset is designed to reflect real-world deployment conditions and serve as a diverse and challenging benchmark. The dataset is divided into ten categories: animals, architecture, art, food, nature, objects, portraits, sports, text, and urban scenes. Five distinct degradation methods are applied to each category, including various downsampling approaches, blurring, and JPEG compression.
提供机构:
西班牙Cidaut人工智能实验室和维尔茨堡大学计算机视觉实验室
创建时间:
2025-10-15
搜集汇总
数据集介绍
main_image_url
构建方式
在感知超分辨率研究领域,PSR4K数据集的构建采用了系统化的多维度退化策略。该数据集包含500张4K分辨率测试图像,涵盖动物、建筑、艺术等十个语义类别,每个类别均施加了五种不同的复合退化模式。退化流程融合了多种下采样方法、模糊算子及JPEG压缩技术,通过私有的退化管道设计确保基准测试的严谨性。输入图像统一规范为960×540像素,经4倍上采样后生成3840×2160像素的超高清输出,这种设计既模拟了真实部署场景的复杂性,又为算法评估提供了标准化尺度。
特点
PSR4K数据集的核心特征体现在其语义多样性与退化复杂性并重的架构设计。十类语义场景覆盖从自然景观到人工造物的视觉谱系,每类图像均经历多模态退化处理,有效规避了传统双三次退化模型的局限性。数据集特别注重对纹理丰富场景的挑战性构建,如食物类别中精细结构的退化模拟,以及运动场景的动态模糊还原。其评估体系创新性地融合了感知指数、CLIPIQA与MANIQA三类无参考质量评估指标,通过加权积分机制建立综合感知质量度量标准,为超分辨率算法的跨场景鲁棒性提供多维验证基础。
使用方法
该数据集作为感知超分辨率研究的基准平台,其使用遵循严格的效率与质量双重约束框架。研究需在不超过500万参数和2000GFLOPs的计算预算内,以960×540像素输入为基准进行模型优化。评估流程采用三阶段验证机制:首先在RealSRSet和Real47数据集进行本地验证,继而通过标准化测试平台提交代码与输出结果,最终由组织方在受控环境中复现验证。数据集支持跨基准泛化测试,包括DIV2K-LSDIR、PIPAL等传统感知超分辨率数据集,通过类级性能分析揭示算法在特定语义场景下的感知特性与局限。
背景与挑战
背景概述
PSR4K数据集由Cidaut AI与维尔茨堡大学计算机视觉实验室于2025年联合构建,旨在推动高效感知超分辨率研究的发展。该数据集聚焦于解决真实场景下图像重建的感知质量与计算效率平衡问题,包含500张4K分辨率测试图像,涵盖动物、建筑、艺术等十类语义场景,并采用多重退化模型模拟现实复杂退化条件。作为AIM 2025研讨会核心基准,PSR4K通过严格限制模型参数量与计算复杂度,推动了移动端超分辨率技术的实用化进程。
当前挑战
在领域问题层面,PSR4K需应对感知质量与失真指标的固有矛盾,传统方法在优化PSNR时易产生纹理平滑现象,而生成式模型又面临计算资源瓶颈。构建过程中,需设计覆盖真实退化类型的多样化数据流水线,同时确保评估指标能有效捕捉视觉伪影与幻觉现象。此外,跨语义类别的一致性评估要求模型具备对复杂纹理与结构特征的泛化能力,尤其在食物、体育等高频细节丰富的场景中保持稳定性。
常用场景
经典使用场景
在计算机视觉领域,PSR4K数据集主要应用于高效感知超分辨率研究,其经典使用场景包括对低分辨率图像进行4倍上采样处理,生成具有优异视觉质量的3840×2160像素超高清图像。该数据集涵盖动物、建筑、艺术等十个语义类别,通过模拟真实世界复杂退化过程,为评估模型在多样化内容上的感知性能提供了标准化基准。
实际应用
在实际应用层面,PSR4K支撑的模型可显著提升移动设备图像增强能力,使智能手机能够实时处理4K超分辨率任务。在医疗影像分析领域,该技术有助于提升低分辨率医学图像的诊断价值;在卫星遥感应用中,能有效改善图像细节还原度;在文化遗产数字化保护方面,可为历史影像修复提供技术支撑。
衍生相关工作
基于PSR4K数据集衍生的经典工作包括VPEG团队提出的空间自适应特征调制网络,通过精简通道维度与多阶段训练策略实现感知质量突破;MiAlgo团队开发的TinyESRGAN通过重构RRDB模块达成79%计算量压缩;IPIU团队则探索了边缘增强特征蒸馏网络,这些成果共同推动了高效感知超分辨率研究范式的演进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作