five

OmniEdit-Filtered-1.2M|图像编辑数据集|数据质量数据集

收藏
github2024-12-05 更新2024-12-06 收录
图像编辑
数据质量
下载链接:
https://github.com/TIGER-AI-Lab/OmniEdit
下载链接
链接失效反馈
资源简介:
该数据集包含1.2M对图像编辑任务的配对,涵盖了七种不同的技能,如添加、交换、移除、属性修改、背景更改、环境更改和风格转移。数据集经过VIEScore过滤,确保了数据的高质量和多样性。
创建时间:
2024-11-11
原始信息汇总

OmniEdit 数据集概述

数据集简介

  • 名称: OmniEdit
  • 描述: OmniEdit 是一个全能的图像编辑模型,能够无缝处理七种不同的图像编辑任务,涵盖任意宽高比。该数据集通过专家模型的监督训练,确保任务覆盖全面。

数据集特点

  1. 任务覆盖: 数据集包含七种不同的图像编辑技能,包括添加、交换、移除、属性修改、背景更改、环境更改和风格转换。
  2. 数据质量: 使用基于大型多模态模型(如 GPT-4o)评分的重要性采样方法,而非传统的 CLIP-score,以提高数据质量。
  3. 数据规模: 数据集包含 1.2M 对图像编辑数据,经过 VIEScore 过滤。

数据集结构

  • 数据合成: 数据集通过专家模型蒸馏合成,具体流程如下图所示: <p align="center"> <img src="https://huggingface.co/datasets/TIGER-Lab/OmniEdit-Filtered-1.2M/resolve/main/synthesis.png" width="800"> </p>

与其他数据集的比较

  • 多样性和质量: OmniEdit 数据集在多样性和图像编辑对的质量方面优于其他数据集,支持任意分辨率。 <p align="center"> <img src="https://huggingface.co/datasets/TIGER-Lab/OmniEdit-Filtered-1.2M/resolve/main/comparison.png" width="800"> </p>

引用信息

  • 引用格式:

    @article{wei2024omniedit, title={OmniEdit: Building Image Editing Generalist Models Through Specialist Supervision}, author={Wei, Cong and Xiong, Zheyang and Ren, Weiming and Du, Xinrun and Zhang, Ge and Chen, Wenhu}, journal={arXiv preprint arXiv:2411.07199}, year={2024} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建OmniEdit-Filtered-1.2M数据集时,研究团队采用了专家模型蒸馏的方法,通过七个不同的专家模型来确保任务覆盖的全面性。具体而言,数据集的合成过程依赖于重要性采样技术,该技术基于大型多模态模型(如GPT-4o)提供的评分,而非传统的CLIP评分,从而显著提升了数据质量。最终,经过VIEScore过滤的1.2M对图像编辑数据被纳入数据集,涵盖了添加、交换、移除、属性修改、背景变化、环境变化和风格转换等七种不同的技能。
特点
OmniEdit-Filtered-1.2M数据集以其多样性和高质量著称,提供了任意分辨率的图像编辑对。相较于其他数据集,该数据集在图像编辑任务的多样性和质量上均表现出色,能够无缝处理不同长宽比的图像编辑任务。此外,数据集的构建过程中采用了基于GPT-4o评分的重要性采样方法,确保了数据的高质量和广泛适用性。
使用方法
OmniEdit-Filtered-1.2M数据集适用于训练和验证图像编辑领域的通用模型。用户可以通过访问Hugging Face平台获取该数据集,并将其用于各种图像编辑任务的模型训练和评估。数据集的多样性和高质量特性使其成为开发和测试图像编辑模型的理想选择,尤其适用于需要处理多种编辑任务和不同长宽比图像的应用场景。
背景与挑战
背景概述
OmniEdit-Filtered-1.2M数据集是由TIGER-AI-Lab团队在2024年发布的,旨在支持多任务图像编辑模型的训练。该数据集的核心研究问题是如何通过专家模型的监督,构建一个能够无缝处理七种不同图像编辑任务的通用编辑器。OmniEdit-Filtered-1.2M包含了120万对高质量的图像编辑样本,涵盖了添加、交换、移除、属性修改、背景变化、环境变化和风格转换等七种技能。该数据集的发布对图像编辑领域具有重要影响,为研究人员提供了一个多样化且高质量的数据资源,推动了图像编辑技术的发展。
当前挑战
OmniEdit-Filtered-1.2M数据集在构建过程中面临了多重挑战。首先,如何确保数据集能够覆盖所有七种图像编辑任务,需要精心设计和实施专家模型的监督策略。其次,数据质量的提升依赖于基于大型多模态模型(如GPT-4o)的重要性采样方法,而非传统的CLIP评分,这增加了数据合成的复杂性。此外,数据集的多样性和高质量要求使得筛选过程尤为关键,需使用VIEScore等工具进行严格过滤。这些挑战不仅影响了数据集的构建效率,也对后续模型的训练效果提出了高要求。
常用场景
经典使用场景
在图像编辑领域,OmniEdit-Filtered-1.2M数据集以其涵盖七种不同编辑任务的全面性而著称。该数据集的经典使用场景包括训练通用图像编辑模型,通过利用来自七个专业模型的监督,确保模型能够无缝处理任何宽高比的图像编辑任务。例如,模型可以执行图像添加、交换、移除、属性修改、背景更改、环境变化和风格转换等操作,从而在实际应用中展现出卓越的灵活性和适应性。
实际应用
在实际应用中,OmniEdit-Filtered-1.2M数据集支持的通用图像编辑模型在多个行业中展现出广泛的应用潜力。例如,在广告设计中,设计师可以利用该模型快速进行图像的多种编辑操作,提高工作效率;在影视制作中,该模型可以帮助艺术家进行复杂的图像处理,如背景替换和风格转换,从而提升作品的艺术效果。此外,该数据集还为自动化图像编辑工具的开发提供了坚实的基础。
衍生相关工作
基于OmniEdit-Filtered-1.2M数据集,研究者们已经开展了一系列相关工作。例如,有研究团队利用该数据集开发了能够自动识别和编辑图像中特定对象的模型,进一步提升了图像编辑的智能化水平。此外,还有研究聚焦于优化数据集的生成过程,通过引入更先进的评分机制,提高了数据集的质量和多样性。这些衍生工作不仅丰富了图像编辑领域的研究内容,也为实际应用提供了更多可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录