GenIR

Name: GenIR
Creator: 中国科学院自动化研究所
Published: 2024-10-24 19:57:20
License: 暂无描述

arXiv2024-10-24 更新2024-10-29 收录

下载链接：

https://github.com/shallowdream204/DreamClear

下载链接

链接失效反馈

官方服务：

资源简介：

GenIR数据集由中国科学院自动化研究所创建，旨在解决真实世界图像恢复中的数据不足问题。该数据集包含一百万张高质量图像，通过创新的图像-文本对构建、双提示微调及数据生成与过滤三个阶段生成。数据集的创建过程避免了传统的数据爬取方法，确保了版权合规和隐私安全。GenIR数据集主要应用于图像恢复领域，旨在提升模型对多样化和复杂化真实世界图像降质的处理能力。

The GenIR dataset was created by the Institute of Automation, Chinese Academy of Sciences, with the aim of addressing the shortage of training data for real-world image restoration. This dataset comprises one million high-quality images, which are generated through three sequential stages: innovative image-text pair construction, dual-prompt fine-tuning, and data generation and filtering. The development process of the dataset avoids traditional data crawling approaches, thus ensuring copyright compliance and privacy protection. The GenIR dataset is primarily utilized in the field of image restoration, with the objective of enhancing the model's ability to process diverse and complex real-world image degradations.

提供机构：

中国科学院自动化研究所

创建时间：

2024-10-24

原始信息汇总

DreamClear 数据集概述

数据集名称

DreamClear

数据集描述

DreamClear 是一个用于真实世界图像恢复的高容量数据集，强调隐私安全的数据集构建。

数据集内容

RealLQ250 基准: 包含 250 张真实世界的低质量（LQ）图像。
训练数据: 提供高质量（HQ）和低质量（LQ）图像对，用于图像恢复模型的训练。

数据集下载

RealLQ250 基准: 可从 Google Drive 下载。
预训练模型: 可在 Huggingface 下载。

数据集使用

训练

准备训练数据: 生成高质量和低质量图像对。
提取文本特征: 使用 T5 模型提取文本特征。
训练 DreamClear: 使用提供的配置文件和预训练模型进行训练。

推理

图像恢复: 使用 DreamClear 模型将低质量图像恢复到高质量。
高级别基准测试: 提供分割和检测的测试指令。

数据集许可证

该数据集的代码和预训练权重基于 Apache 2.0 许可证。

引用

如果使用该数据集，请引用以下论文：

@article{ai2024dreamclear, title={DreamClear: High-Capacity Real-World Image Restoration with Privacy-Safe Dataset Curation}, author={Ai, Yuang and Zhou, Xiaoqiang and Huang, Huaibo and Han, Xiaotian and Chen, Zhengyu and You, Quanzeng and Yang, Hongxia}, journal={Advances in Neural Information Processing Systems}, year={2024} }

搜集汇总

数据集介绍

构建方式

GenIR数据集的构建采用了创新的双提示学习管道，分为三个阶段：图像-文本对构建、双提示微调和数据生成与过滤。首先，利用现有的图像恢复数据集和先进的MLLM（如Gemini-1.5-Pro）生成图像-文本对，并通过图像到图像的管道生成负样本。接着，应用双提示学习策略对预训练的T2I模型进行微调，以生成适合数据合成的提示。最后，利用MLLM生成多样化的场景描述，并通过微调后的T2I模型合成图像，确保生成的图像不包含可识别的个人隐私信息。整个过程避免了繁琐的数据爬取，确保了版权合规和隐私安全。

特点

GenIR数据集的主要特点在于其大规模和高质量。该数据集包含一百万张高分辨率图像，涵盖了广泛的场景和多样化的降质类型，为训练高容量的图像恢复模型提供了丰富的资源。此外，GenIR数据集的构建过程注重隐私保护，确保生成的图像不包含任何个人隐私信息，符合当前人工智能领域对数据安全和隐私保护的高要求。

使用方法

GenIR数据集适用于各种图像恢复任务的训练和评估。研究人员可以使用该数据集训练新的图像恢复模型，或者作为现有模型的补充数据集以提高其性能。由于数据集的高质量和多样性，它特别适合用于训练能够处理复杂真实世界降质情况的模型。此外，GenIR数据集还可以用于评估模型的泛化能力和鲁棒性，帮助研究人员开发更加通用和高效的图像恢复技术。

背景与挑战

背景概述

GenIR数据集由自动化数据采集管道GenIR生成，旨在解决真实世界图像恢复（IR）中缺乏高质量数据集的问题。该数据集由中科院自动化研究所、中国科学技术大学和字节跳动公司联合开发，于2024年发布。GenIR的核心研究问题是如何在不侵犯版权和隐私的前提下，高效地构建大规模、高质量的图像恢复数据集。该数据集的创建对图像恢复领域具有重要意义，因为它为训练高容量模型提供了必要的资源，从而推动了真实世界图像恢复技术的发展。

当前挑战

GenIR数据集面临的挑战主要集中在两个方面。首先，构建过程中需要解决版权和隐私保护的问题，确保数据集的合法性和道德性。其次，由于真实世界图像的退化类型多样且复杂，如何准确模拟这些退化并生成高质量的低质量图像对数据集的构建提出了技术挑战。此外，数据集的规模和质量直接影响到训练模型的效果，因此如何在有限的资源下生成足够多样化和高质量的图像也是一个重要的挑战。

常用场景

经典使用场景

GenIR数据集在图像恢复领域中被广泛应用于训练高容量模型，以应对真实世界中复杂多变的图像退化问题。通过其创新的图像-文本对构建和双提示微调策略，GenIR数据集能够生成大规模、高质量且隐私安全的图像数据，为图像恢复模型提供了丰富的训练资源。例如，DreamClear模型利用GenIR数据集进行训练，显著提升了在处理多种真实世界退化情况下的图像恢复效果。

解决学术问题

GenIR数据集解决了现有图像恢复数据集规模有限、难以覆盖真实世界多样性退化场景的问题。通过自动化的数据生成和筛选流程，GenIR数据集不仅大幅提升了数据量，还确保了数据的高质量和隐私安全，从而为图像恢复研究提供了更为可靠和广泛的数据支持。这使得研究人员能够训练出更具泛化能力和实用性的图像恢复模型，推动了该领域的技术进步。

衍生相关工作

基于GenIR数据集，研究者们开发了多种先进的图像恢复模型，如DreamClear，该模型通过集成降解先验信息和扩散变换器架构，显著提升了图像恢复的性能。此外，GenIR数据集的成功应用也激发了其他研究者在数据生成和隐私保护方面的创新，推动了图像恢复领域整体技术水平的提升。未来，GenIR数据集有望成为更多图像处理和计算机视觉任务的基础数据集，进一步扩展其应用范围和影响力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集