five

SR-Ground

收藏
Hugging Face2026-04-08 更新2026-04-09 收录
下载链接:
https://huggingface.co/datasets/Divotion/SR-Ground
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专注于超分辨率(SR)和图像质量基础任务,包含用于训练和评估的图像样本及其对应的注释。数据集结构包括两个主要文件夹:'datasets'包含原始图像、低分辨率图像、双三次插值上采样图像和超分辨率图像;'outputs'包含图像质量基础和超分辨率伪影检测方法的输出。数据集还提供了经过众包精修的掩模,以及用于训练的JSON文件,其中包含图像路径、注释路径和失真显著性等信息。该数据集适用于超分辨率、图像质量评估和相关计算机视觉任务的研究与开发。
创建时间:
2026-04-02
原始信息汇总

SR-Ground 数据集概述

数据集基本信息

  • 数据集名称: SR-Ground
  • 许可证: CC-BY-4.0
  • 托管地址: https://huggingface.co/datasets/Divotion/SR-Ground

数据集内容与结构

数据集包含用于图像质量定位和超分辨率伪影检测的数据。

主要文件夹

  1. datasets 文件夹

    • 包含图像样本。
    • 每个样本文件夹的路径模板为:datasets/<sr>_<preset>/
      • sr: 用于上采样的超分辨率方法名称。
      • preset: 用于获取低分辨率图像的缩放因子。
    • 每个样本目录包含4个文件:
      • 真实(无瑕疵)图像(无后缀文件)。
      • 低分辨率图像(带有 @LR@ 后缀的文件)。
      • 使用双三次插值上采样的低分辨率图像(带有 @RF@ 后缀的文件)。
      • 上采样图像(带有 @SR@ 后缀的文件)。
  2. outputs 文件夹

    • 包含图像质量定位和超分辨率伪影检测方法的输出。
    • 每个样本文件的路径模板为:outputs/<sr>_<preset>/<type>/<sample_name>.npy.gz
      • srpreset 含义同上。
      • type: 被分割的失真类型(可以是 real_distortionssr_artifacts)。
      • sample: 超分辨率图像的名称(与 datasets 文件夹中的上采样图像名称相同)。

标注文件

  1. masks_for_markup.json

    • JSON 文件,包含一个字典,记录了经过众包精修的掩码名称。
    • 键是失真类型,值是样本名称列表。
    • 每个名称的格式为:<sr>_<preset>/<distortion_type>/<sample_name>
  2. srground_train.json

    • JSON 文件,包含 SR-Ground 数据集的样本列表。
    • 列表中每个对象包含以下键:
      • image_path: 超分辨率图像的路径。
      • real_distortions_ann_path: 图像真实失真标注的路径。
      • sr_artifacts_ann_path: 图像超分辨率伪影标注的路径。
      • prominences: 每种失真类型的显著度列表(按以下顺序呈现:blur, jitter, low-light, noise, overexposure, Super-Resolution artifact)。
      • has_markup: 技术标志,显示图像的任一掩码是否经过众包精修。

数据标注与处理

  • 数据集的标注基于对 Q-Ground 数据集的过滤和改进。
  • 通过众包平台(Yandex Tasks)对图像质量定位模型和超分辨率伪影检测模型提供的掩码进行了精修。
  • 为每个掩码计算了显著度(prominence),即认为失真存在的标注者比例。
  • 在最终标注过程中,移除了 jitternoise 失真类型。
  • 总共为 18,900 个掩码进行了标注。

相关模型训练

  • 数据集支持图像质量定位模型(如 SegFormer、Mask2Former)和交互式超分辨率模型(基于 OSEDiff)的训练。
  • 提供了详细的模型训练配置、损失函数和评估结果(见表1和表2)。
搜集汇总
数据集介绍
main_image_url
构建方式
在图像质量评估领域,SR-Ground数据集的构建体现了对超分辨率图像失真标注的精细化追求。该数据集以Q-Ground为基础,通过图像质量定位模型与超分辨率伪影检测模型生成初始掩码,并针对模型置信度较低的掩码进行众包标注优化。具体而言,从模糊、低光照、过曝及超分辨率伪影等失真类型中,依据不确定性评分筛选出部分掩码,经由Yandex Tasks平台邀请多名标注者进行投票,以计算每个掩码的显著性,从而获得更可靠的地面真值标注。
特点
SR-Ground数据集的核心特点在于其提供了多层次的图像质量标注信息。数据集不仅包含原始高分辨率图像、低分辨率图像及经过不同超分辨率方法处理后的图像,还附带了针对真实失真与超分辨率伪影的像素级分割掩码。尤为突出的是,数据集引入了基于众包标注的显著性度量,能够反映不同失真区域的视觉显著程度,这为模型训练提供了更丰富的监督信号。此外,数据集通过过滤Q-Ground中覆盖全图的无效标注,确保了失真定位的局部性与标注质量的一致性。
使用方法
SR-Ground数据集主要应用于图像质量定位与可控超分辨率模型的训练与评估。研究人员可通过加载数据集中的JSON文件,获取图像路径、标注掩码路径及失真显著性列表,进而构建训练样本。在模型训练过程中,可利用数据集中提供的多分辨率图像及对应的失真掩码,设计损失函数以优化分割性能。对于交互式超分辨率任务,用户可依据数据集中的多通道掩码张量,指定需要添加或移除的失真类型及区域,实现精细化的图像增强控制。
背景与挑战
背景概述
SR-Ground数据集是面向图像质量评估与超分辨率领域的研究资源,其构建旨在解决图像质量接地与超分辨率伪影检测的核心问题。该数据集由研究团队在近期创建,依托于Yandex Tasks等众包平台进行精细标注,主要聚焦于对真实失真与超分辨率伪影的局部化分割。通过整合多种超分辨率方法生成的图像及其对应的地面真值、低分辨率版本和上采样结果,SR-Ground为开发交互式图像增强模型提供了数据基础,推动了图像处理领域从全局质量评估向细粒度失真分析的技术演进。
当前挑战
SR-Ground数据集面临的挑战主要体现在两个方面:其一,在解决图像质量接地与超分辨率伪影检测的领域问题时,模型需准确分割局部失真区域,而现有标注数据中存在大量覆盖整张图像的单一失真掩码,这破坏了失真的局部性,导致模型倾向于预测恒定掩码,从而影响分割精度与泛化能力。其二,在数据集构建过程中,众包标注环节面临标注一致性与成本效率的平衡难题,例如需要合理设置投票数量以控制置信区间长度,同时需手动审核并排除如抖动和噪声等失真类型的错误标注,以确保标注数据的可靠性与有效性。
常用场景
经典使用场景
在图像质量评估与超分辨率研究领域,SR-Ground数据集为图像质量定位任务提供了精细的标注基准。该数据集通过提供包含原始高分辨率图像、低分辨率图像、双三次插值上采样图像以及超分辨率重建图像的多版本样本,并辅以真实失真与超分辨率伪影的像素级掩码标注,使得研究者能够训练和评估模型在复杂失真条件下的定位能力。经典使用场景涉及利用SegFormer或Mask2Former等先进分割架构,在数据集上训练图像质量定位模型,以精准识别图像中的模糊、抖动、低光照、噪声、过曝及超分辨率伪影等六类失真区域,为后续的图像增强与修复提供关键引导。
实际应用
在实际应用层面,SR-Ground数据集支撑了交互式超分辨率与图像增强系统的开发。基于该数据集训练的模型能够精准定位图像中的各类失真,用户可通过指定多通道掩码来指示添加或移除特定失真,实现可控的图像编辑。例如,在摄影后期处理中,系统可针对低光照区域进行选择性提亮,或消除超分辨率引入的伪影;在监控视频增强中,能有效抑制噪声并修复模糊区域。这种以失真定位为驱动的交互式框架,显著提升了图像增强的灵活性与实用性,为消费级图像处理软件与专业视觉系统提供了技术核心。
衍生相关工作
围绕SR-Ground数据集,衍生出一系列聚焦于图像质量定位与交互式增强的经典研究工作。基于该数据集,研究者优化了SegFormer与Mask2Former等分割模型在失真定位任务上的训练策略,探讨了损失函数组合、分辨率设置及数据过滤的影响。进一步地,结合OSEDiff等扩散模型,发展了支持用户掩码引导的交互式超分辨率框架,实现了失真概率的定向调控。这些工作不仅深化了对图像失真语义的理解,也推动了图像处理从全自动优化向人机协同编辑的演进,为后续的细粒度图像质量评估与生成模型研究提供了重要借鉴。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作