five

HQ-Edit|图像编辑数据集|人工智能图像生成数据集

收藏
github2024-04-15 更新2024-05-31 收录
图像编辑
人工智能图像生成
下载链接:
https://github.com/UCSC-VLAA/HQ-Edit
下载链接
链接失效反馈
资源简介:
HQ-Edit is a high-quality and high-coverage instruction-based image editing dataset with around 200,000 edits collected with GPT-4V and DALL-E 3. HQ-Edit’s high-resolution images, rich in detail and accompanied by comprehensive editing prompts, substantially enhance the capabilities of existing image editing models.
创建时间:
2024-04-15
原始信息汇总

HQ-Edit数据集概述

数据集简介

HQ-Edit是一个高质量、高覆盖率的基于指令的图像编辑数据集,包含约200,000次编辑,这些编辑是通过GPT-4V和DALL-E 3收集的。该数据集的特点是高分辨率图像,细节丰富,并配有全面的编辑提示,显著提升了现有图像编辑模型的能力。

数据集用途

  • 用于提升图像编辑模型的性能。
  • 支持研究基于指令的图像编辑技术。

数据集内容

  • 约200,000次图像编辑实例。
  • 高分辨率图像及其详细的编辑指令。

数据集使用

  • 需要安装特定的库和模型,如accelerate, transformers, diffusers等。
  • 使用示例代码展示了如何加载模型并进行图像编辑。

引用信息

若使用HQ-Edit数据集或其微调检查点,请引用以下文献:

@article{hui2024hq, title = {HQ-Edit: A High-Quality Dataset for Instruction-based Image Editing}, author = {Hui, Mude and Yang, Siwei and Zhao, Bingchen and Shi, Yichun and Wang, Heng and Wang, Peng and Zhou, Yuyin and Xie, Cihang}, journal = {arXiv preprint arXiv:2404.09990}, year = {2024} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
HQ-Edit数据集的构建基于GPT-4V和DALL-E 3的强大生成能力,精心收集了约200,000个高质量的图像编辑实例。这些实例不仅包括高分辨率的图像,还附有详尽的编辑指令,确保了数据集的丰富性和多样性。通过这种方式,HQ-Edit数据集为图像编辑模型的训练提供了坚实的基础,显著提升了模型的编辑能力和泛化性能。
特点
HQ-Edit数据集以其高分辨率和丰富的细节著称,每个图像都经过精心挑选和编辑,确保了数据的高质量。此外,数据集中的编辑指令详尽且多样化,涵盖了广泛的编辑需求,从而使得模型能够应对各种复杂的编辑任务。这种高覆盖率和高质量的特点,使得HQ-Edit成为图像编辑领域的重要资源。
使用方法
使用HQ-Edit数据集进行模型训练时,首先需安装必要的库,如accelerate和transformers,并从GitHub上获取diffusers库。随后,通过加载预训练的StableDiffusionInstructPix2PixPipeline模型,结合EulerAncestralDiscreteScheduler调度器,可以高效地进行图像编辑。用户可以通过提供具体的编辑指令,如'将天空变为多云',来生成所需的编辑图像,并保存结果。
背景与挑战
背景概述
HQ-Edit数据集是由Mude Hui及其团队在2024年创建的,旨在提升图像编辑模型的性能。该数据集包含了约200,000个高质量的图像编辑实例,这些实例通过GPT-4V和DALL-E 3生成,具有高分辨率和丰富的细节。HQ-Edit不仅提供了广泛的编辑指令,还通过其高质量的图像数据,显著增强了现有图像编辑模型的能力。这一数据集的推出,标志着图像编辑领域在数据质量和覆盖范围上的重大进步,为未来的研究提供了坚实的基础。
当前挑战
HQ-Edit数据集在构建过程中面临了多个挑战。首先,生成高质量且多样化的图像编辑指令需要强大的自然语言处理能力,这依赖于GPT-4V和DALL-E 3等先进技术的支持。其次,确保图像的高分辨率和细节丰富性,以满足实际应用的需求,也是一个技术难题。此外,数据集的覆盖范围和多样性要求在收集和处理过程中进行精细的筛选和优化。这些挑战不仅推动了图像编辑技术的发展,也为后续研究提供了宝贵的经验和数据支持。
常用场景
经典使用场景
在图像编辑领域,HQ-Edit数据集以其高质量和高覆盖率的特点,成为指令型图像编辑任务的经典资源。该数据集包含约200,000个编辑实例,每个实例均由GPT-4V和DALL-E 3生成,提供了高分辨率的图像和详尽的编辑提示。这些丰富的细节和全面的编辑指令,极大地提升了现有图像编辑模型的性能,使其在处理复杂编辑任务时表现更为出色。
实际应用
在实际应用中,HQ-Edit数据集为图像编辑工具的开发和优化提供了强有力的支持。例如,在广告设计、影视制作和游戏开发等领域,设计师和艺术家可以利用该数据集训练的模型,快速生成高质量的图像编辑效果。此外,HQ-Edit还支持个性化图像编辑应用的开发,用户可以通过简单的指令,实现对图像的精细调整,极大地提升了用户体验和工作效率。
衍生相关工作
基于HQ-Edit数据集,研究者们开展了一系列相关工作,推动了图像编辑领域的技术进步。例如,有研究团队利用该数据集开发了新的图像编辑算法,显著提升了编辑效果的逼真度和细节表现。此外,还有学者基于HQ-Edit提出了新的图像编辑评估指标,为该领域的标准化研究提供了新的思路。这些衍生工作不仅丰富了图像编辑的理论体系,也为实际应用提供了更多可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

Arizona Cities by Population

A dataset listing Arizona cities by population for 2024.

www.arizona-demographics.com 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

DLLG数据集

DLLG数据集是一个包含道路垃圾图片的数据集,主要用于训练深度学习模型以识别和分类道路垃圾。数据集来源包括机器人视角拍摄、手机相机拍摄和网络图片,涵盖塑料袋、饮料瓶和易拉罐三类垃圾。数据集旨在增强训练网络的鲁棒性,通过不同时间、天气和光照条件下的图片收集,以及包含不同形态的垃圾案例。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录