KonJND-1k

Name: KonJND-1k
Creator: 北京大学计算机科学学院视觉技术国家工程研究中心
Published: 2024-12-23 19:09:30
License: 暂无描述

arXiv2024-12-23 更新2024-12-25 收录

下载链接：

http://arxiv.org/abs/2412.17477v1

下载链接

链接失效反馈

官方服务：

资源简介：

KonJND-1k数据集由北京大学视觉技术国家工程研究中心创建，主要用于评估压缩图像的用户满意度和机器满意度。该数据集包含1,008张原始图像和76,000张压缩图像，涵盖了不同压缩参数下的图像质量变化。数据集的创建过程涉及通过主观测试收集人类对图像质量的感知数据，并通过多种图像质量评估模型生成机器感知标签。该数据集主要应用于图像压缩优化和图像质量评估领域，旨在提高压缩图像的用户体验和机器分析性能。

KonJND-1k dataset was developed by the National Engineering Research Center for Visual Technology at Peking University, primarily for evaluating user satisfaction and machine satisfaction of compressed images. This dataset comprises 1,008 original images and 76,000 compressed images, covering image quality variations under different compression parameters. The construction of this dataset entails collecting human perceptual ratings of image quality through subjective tests, as well as generating machine-perceived labels using multiple image quality assessment models. This dataset is mainly applied in the fields of image compression optimization and image quality assessment, with the goal of improving the user experience of compressed images and the performance of machine-based image analysis.

提供机构：

北京大学计算机科学学院视觉技术国家工程研究中心

创建时间：

2024-12-23

搜集汇总

数据集介绍

构建方式

KonJND-1k数据集的构建基于大规模的主观测试，旨在评估压缩图像的人类感知质量。该数据集包含1,008张原始图像及其76,000张压缩版本，每张压缩图像都通过量化参数（QP）控制其压缩程度。为了获取Satisfied User Ratio (SUR)标签，研究人员通过主观测试收集了大量人类受试者对压缩图像的质量感知结果，计算了无法感知原始图像与压缩图像之间质量差异的受试者比例。此外，数据集还引入了Satisfied Machine Ratio (SMR)标签，通过模拟机器视觉系统对图像质量的分析，计算了无法感知质量差异的机器比例。这种双重标注方式使得数据集能够同时反映人类和机器对图像质量的感知特性。

特点

KonJND-1k数据集的特点在于其双重标注机制，既包含人类感知质量标签（SUR），也包含机器感知质量标签（SMR）。这种设计使得数据集能够全面评估压缩图像在人类和机器视角下的质量表现。此外，数据集的压缩图像涵盖了多种压缩级别，从轻微到严重压缩，提供了丰富的质量变化范围。SUR和SMR的分布呈现出不同的特性，SUR曲线通常单调递减，而SMR曲线则表现出更大的波动性，反映了机器视觉系统对压缩失真的敏感性差异。这种细粒度的标注使得数据集能够支持高精度的图像质量评估任务。

使用方法

KonJND-1k数据集主要用于训练和评估图像质量评估模型，特别是针对压缩图像的SUR和SMR预测任务。研究人员可以通过该数据集训练深度学习模型，学习人类和机器对压缩图像质量的感知特性。在使用时，模型通常以原始图像和压缩图像作为输入，通过特征提取和差异学习模块，预测SUR和SMR值。为了提升模型性能，可以采用预训练策略，利用大规模SMR标注数据进行特征提取，再通过微调适应SUR预测任务。此外，数据集还可用于验证不同网络架构在图像质量评估任务中的有效性，例如通过引入Transformer或MLP-Mixer等先进模块，进一步提升预测精度。

背景与挑战

背景概述

KonJND-1k数据集由北京大学视觉技术国家工程研究中心的研究团队于2022年创建，旨在解决压缩图像感知质量评估中的关键问题。随着图像在人类视觉体验和机器视觉分析中的广泛应用，压缩图像的质量评估变得尤为重要。传统图像质量评估（IQA）方法如PSNR和SSIM虽然在像素级差异上表现良好，但与人类感知的相关性较弱。KonJND-1k数据集通过引入“满意用户比例”（SUR）和“满意机器比例”（SMR）的概念，提供了更符合人类视觉系统（HVS）和机器视觉系统（MVS）感知特性的评估指标。该数据集包含1,008张原始图像和76,000张压缩图像，通过大规模众包主观测试生成SUR标签，为压缩图像质量评估提供了重要的基准。

当前挑战

KonJND-1k数据集在构建和应用过程中面临多重挑战。首先，数据集的规模受限，尽管通过压缩生成了大量图像变体，但SUR标签的获取依赖于昂贵且耗时的主观测试，导致标注数据量不足。其次，现有的SUR和SMR预测模型多基于传统卷积神经网络（CNN），未能充分利用最新的网络架构如Transformer或MLP-Mixer，限制了预测精度的进一步提升。此外，SUR和SMR预测任务要求模型在细粒度上捕捉压缩图像的微小质量差异，这对模型的精度和鲁棒性提出了更高要求。最后，如何有效融合HVS和MVS的感知特征，设计统一的预测模型，仍是当前研究的难点。

常用场景

经典使用场景

KonJND-1k数据集在图像压缩质量评估领域具有重要应用，特别是在预测压缩图像的满意用户比例（SUR）和满意机器比例（SMR）方面。该数据集通过大规模的主观测试和机器分析，提供了丰富的压缩图像样本及其对应的SUR和SMR标签，为研究人员提供了一个统一的评估平台。通过该数据集，研究者可以训练深度学习模型，预测不同压缩参数下的图像质量，从而优化压缩算法，提升人类和机器的视觉体验。

解决学术问题

KonJND-1k数据集解决了图像压缩质量评估中的两个核心问题：一是如何准确预测人类对压缩图像的感知质量，二是如何评估机器视觉系统对压缩图像的分析能力。传统的图像质量评估方法（如PSNR和SSIM）往往与人类感知不一致，而该数据集通过引入SUR和SMR指标，直接反映了人类视觉系统（HVS）和机器视觉系统（MVS）的感知特性。此外，该数据集还推动了深度学习模型在图像质量评估中的应用，显著提升了预测精度。

衍生相关工作

KonJND-1k数据集的发布推动了多项相关研究工作的开展。例如，基于该数据集，研究者提出了多种深度学习模型，如SUR-FeatNet和SMRNet，用于预测压缩图像的SUR和SMR。此外，该数据集还激发了关于人类视觉系统和机器视觉系统感知特性的深入研究，推动了图像质量评估领域的理论发展。近年来，结合Transformer和MLP-Mixer等新型网络架构的研究也取得了显著进展，进一步提升了图像质量预测的精度和效率。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集