JPEG AI压缩伪影数据集

arXiv2024-11-11 更新2024-11-13 收录

下载链接：

http://arxiv.org/abs/2411.06810v1

下载链接

链接失效反馈

官方服务：

资源简介：

JPEG AI压缩伪影数据集由MSU人工智能研究所和莫斯科国立大学创建，包含46,440个经过验证的JPEG AI压缩伪影图像。该数据集通过处理来自Open Images数据集的约350,000张独特图像，使用不同的压缩质量参数生成。数据集详细标注了伪影类型和位置，并通过众包主观评估进行了验证。该数据集主要用于测试基于神经网络的图像编解码器，识别这些编解码器中的错误，并提升其性能。

The JPEG AI Compression Artifact Dataset was developed by the MSU Institute of Artificial Intelligence and Lomonosov Moscow State University, containing 46,440 validated JPEG AI compression artifact images. This dataset is generated by processing approximately 350,000 unique images sourced from the Open Images Dataset with diverse compression quality parameters. It includes detailed annotations of artifact types and their corresponding locations, and was validated through crowdsourced subjective assessments. This dataset is primarily intended for testing neural network-based image codecs, identifying errors within such codecs, and enhancing their performance.

提供机构：

MSU人工智能研究所和莫斯科国立大学

创建时间：

2024-11-11

搜集汇总

数据集介绍

构建方式

在构建JPEG AI压缩伪影数据集时，研究团队采用了先进的神经网络压缩技术与传统编码器（如HM18.0）进行对比。通过对约350,000张来自Open Images数据集的图像进行不同压缩质量参数的处理，团队成功识别并收集了46,440个伪影实例。这些伪影通过众包主观评估进行了验证，确保了数据集的高质量与可靠性。

特点

JPEG AI压缩伪影数据集具有多方面的特点。首先，它包含了三种主要类型的伪影：纹理和边界退化、颜色变化以及文本损坏。其次，数据集详细记录了每个伪影的类型、位置和置信度，提供了丰富的标注信息。此外，数据集经过众包主观评估，确保了伪影检测的准确性，为神经网络图像编码器的测试和优化提供了坚实的基础。

使用方法

JPEG AI压缩伪影数据集主要用于测试和验证基于神经网络的图像编码器。研究者可以通过该数据集评估其算法在检测和处理伪影方面的性能，识别潜在的编码器缺陷，并进行相应的改进。此外，数据集还可用于开发新的图像质量评估方法，特别是针对神经网络压缩技术引入的伪影。通过公开的源代码和数据集，研究社区可以共同推动图像压缩技术的发展。

背景与挑战

背景概述

近年来，基于学习的图像压缩方法取得了显著进展，逐渐超越了传统的编解码器。然而，神经网络方法在某些图像中可能会意外引入视觉伪影。为了应对这一问题，Daria Tsereh等研究人员于2024年提出了JPEG AI压缩伪影数据集，旨在检测和量化由神经压缩引起的伪影。该数据集由MSU Institute for Artificial Intelligence和Lomonosov Moscow State University的团队共同开发，通过对约350,000张Open Images数据集中的图像进行处理，生成了包含46,440个伪影的验证数据集。这一数据集不仅为测试神经网络图像编解码器提供了宝贵的资源，还为识别这些编解码器中的错误和提升其性能提供了有力支持。

当前挑战

JPEG AI压缩伪影数据集的构建面临多重挑战。首先，神经压缩伪影的检测和量化需要开发新的方法，以区分这些伪影与传统编解码器产生的伪影。其次，数据集的构建过程中，研究人员必须处理大量图像，确保伪影的准确性和一致性。此外，主观验证的实施也是一大挑战，需要通过众包平台进行大规模的视觉评估，以确保数据集的可靠性。最后，该数据集的应用范围广泛，包括但不限于神经网络图像编解码器的测试和调试，以及图像质量评估方法的改进，这要求数据集在不同应用场景下都能保持高效和准确。

常用场景

经典使用场景

JPEG AI压缩伪影数据集在图像压缩领域中扮演着重要角色，其经典使用场景主要集中在神经网络图像压缩方法的性能评估与优化。通过该数据集，研究者能够系统地检测和量化由神经网络压缩算法引入的视觉伪影，如纹理和边界退化、颜色变化以及文本损坏。这些伪影的检测不仅有助于识别和修复压缩算法中的缺陷，还能为开发更高效、更高质量的图像压缩技术提供数据支持。

解决学术问题

JPEG AI压缩伪影数据集解决了图像压缩领域中一个关键的学术问题，即如何有效评估和改进基于神经网络的图像压缩方法。传统压缩方法的伪影类型相对固定，而神经网络压缩方法可能引入更多不可预测的伪影。该数据集通过提供大量经过验证的伪影样本，帮助研究者开发新的评估指标和检测算法，从而提升神经网络压缩技术的可靠性和性能。

衍生相关工作

JPEG AI压缩伪影数据集的发布催生了多项相关研究工作。例如，基于该数据集，研究者开发了新的图像质量评估方法，这些方法在检测神经网络压缩伪影方面表现出色。此外，该数据集还促进了图像压缩算法的改进，特别是在减少伪影和提高压缩效率方面。这些衍生工作不仅推动了图像压缩技术的发展，也为其他领域的图像处理研究提供了宝贵的参考。

以上内容由遇见数据集搜集并总结生成