UCSC-VLAA/HQ-Edit|图像编辑数据集|人工智能数据集

hugging_face2024-04-17 更新2024-04-19 收录

图像编辑

人工智能

下载链接：

https://hf-mirror.com/datasets/UCSC-VLAA/HQ-Edit

下载链接

链接失效反馈

资源简介：

HQ-Edit是一个高质量的指令式图像编辑数据集，包含总共197,350次编辑。与依赖属性指导或人类反馈构建数据集的传统方法不同，我们设计了一个利用GPT-4V和DALL-E 3等高级基础模型的可扩展数据收集管道。HQ-Edit的高分辨率图像，细节丰富并伴随全面的编辑提示，显著增强了现有图像编辑模型的能力。

提供机构：

UCSC-VLAA

原始信息汇总

数据集概述

名称： HQ-Edit

描述： HQ-Edit是一个高质量的基于指令的图像编辑数据集，包含197,350次编辑。该数据集利用先进的模型GPT-4V和DALL-E 3构建，提供高分辨率图像和详细的编辑指令，显著增强了现有图像编辑模型的能力。

语言： 英语（en）

规模： 10万<n<100万

许可： CC-BY-NC-4.0

数据集结构

input (字符串): 输入图像的描述。
input_image (图像): 输入图像。
edit (字符串): 将输入图像转换为输出图像的编辑指令。
inverse_edit (字符串): 将输出图像转换回输入图像的逆向编辑指令。
output (字符串): 输出图像的描述。
output_image (图像): 输出图像。

数据集分割

训练集： 包含98,675个示例。

引用信息

若使用此数据集，请引用以下论文：

@article{hui2024hq, title = {HQ-Edit: A High-Quality Dataset for Instruction-based Image Editing}, author = {Hui, Mude and Yang, Siwei and Zhao, Bingchen and Shi, Yichun and Wang, Heng and Wang, Peng and Zhou, Yuyin and Xie, Cihang}, journal = {arXiv preprint arXiv:2404.09990}, year = {2024} }

AI搜集汇总

数据集介绍

构建方式

UCSC-VLAA/HQ-Edit数据集的构建采用了一种创新的数据收集管道，该管道借助先进的基模型GPT-4V和DALL-E 3，实现了大规模的数据采集。此数据集包含了197,350个编辑，每个编辑都是由高分辨率图像和详尽的编辑指令组成，这些图像和指令共同构成了数据集的核心内容。

特点

该数据集的特点在于其高质量和丰富的细节。它不仅包含了输入和输出图像，还提供了相应的编辑指令及其逆向指令，这为图像编辑模型提供了全面而具体的指导。此外，数据集的图像分辨率高，细节丰富，有助于提升现有图像编辑模型的性能。

使用方法

用户可以通过HuggingFace的Dataset Viewer在线预览UCSC-VLAA/HQ-Edit数据集。数据集的 splits 包括训练集，共98,675个样本。用户可以根据需要，利用数据集中的输入图像、编辑指令以及输出图像进行模型训练、评估和测试。在使用数据集时，需遵守cc-by-nc-4.0版权协议。

背景与挑战

背景概述

在图像编辑领域，UCSC-VLAA/HQ-Edit数据集标志着一次重要的技术进步，由Mude Hui等人于2024年创建。该数据集通过运用先进的预训练模型GPT-4V和DALL-E 3，构建了一个可扩展的数据收集流程，旨在提升图像编辑模型的性能。数据集包含197,350个高质量编辑，其特色在于高分辨率图像和详尽的编辑提示，这些特性极大地增强了现有图像编辑模型的处理能力。该数据集的问世，对图像编辑研究产生了深远影响，推动了相关技术的发展。

当前挑战

UCSC-VLAA/HQ-Edit数据集在构建过程中面临了多重挑战。首先，如何确保数据收集流程的可持续性和编辑指令的准确性是一个关键问题。其次，数据集需要解决如何平衡图像质量与数据量的关系，以保证模型训练的有效训练。此外，编辑指令的可逆性增加了数据构建的复杂性，要求输出图像能够精确还原至原始状态。这些挑战不仅考验了数据集构建者的技术能力，也推动了图像编辑领域的创新解决方案的发展。

常用场景

经典使用场景

在图像处理与编辑领域，UCSC-VLAA/HQ-Edit数据集以其高分辨率图像和详尽的编辑提示，成为提升现有图像编辑模型能力的宝贵资源。该数据集的经典使用场景在于，研究者可通过其中的输入图像、编辑指令以及输出图像，训练模型以学习执行复杂的图像编辑任务，如风格转换、色彩调整等，从而实现自动化的图像编辑流程。

实际应用

在实际应用中，UCSC-VLAA/HQ-Edit数据集可用于改进图像处理软件的自动化编辑功能，使得普通用户能够通过简单的文本指令实现专业级别的图像编辑效果，广泛应用于广告设计、摄影后期等领域，极大地提升了工作效率。

衍生相关工作

基于UCSC-VLAA/HQ-Edit数据集，研究者们衍生出了一系列相关工作，如编辑指令的优化算法、图像编辑效果的评估方法等。这些工作不仅推动了图像编辑技术的进步，也为相关领域的理论研究提供了新的视角和数据基础。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4099个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国劳动力动态调查

“中国劳动力动态调查” （China Labor-force Dynamics Survey，简称 CLDS）是“985”三期“中山大学社会科学特色数据库建设”专项内容，CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查，系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响，建立劳动力、家庭和社区三个层次上的追踪数据库，从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。

中国学术调查数据资料库收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey（CHNS）是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目，旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响，以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体，采用多阶段随机抽样方法，收集了家庭、个体以及社区层面的详细数据，包括饮食、健康、经济和社会因素等信息。自2011年起，CHNS不断扩展，新增多个城市和省份，并持续完善纵向数据链接，为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集，专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例，收集自自然雾霾环境和正常场景中人工添加的雾霾效果，以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型，确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测，旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

WET (Channel 1) 287 - 00047.tif

:unav

DataCite Commons 收录

CASIA v1.0, CASIA v2.0, Columbia Gray, Columbia Color, NIST 2016(Nimble Challenge 2016 (NC16)), NC17, MFC18, Fantastic Reality, Carvalho, Realistic Tampering, COVERAGE, CoMoFoD

本仓库收集了多个用于图像篡改检测和定位的数据集，包括CASIA v1.0、CASIA v2.0等，这些数据集涵盖了不同的篡改类型和处理方式，用于训练和测试图像篡改检测方法。

github 收录