five

IMIG-100K

收藏
Hugging Face2025-12-15 更新2025-12-16 收录
下载链接:
https://huggingface.co/datasets/ruihangxu/IMIG-100K
下载链接
链接失效反馈
官方服务:
资源简介:
IMIG-100K是一个大规模合成数据集,专为多实例图像生成任务设计。它包含超过10万张高质量图像样本,每张图像都有掩码和布局信息的标注。数据集分为几个子数据集,包括IMIG-Basic、IMIG-Complex和IMIG-Composite,分别针对不同难度的多实例生成任务。IMIG-Basic包含较少实例的图像,适合基础任务;IMIG-Complex包含更多实例和更高复杂度的图像;IMIG-Composite包含由多个参考图像组合而成的复合图像,适合更灵活的生成任务。
创建时间:
2025-12-13
原始信息汇总

IMIG-100K 数据集概述

数据集基本信息

  • 名称: IMIG-100K: A Large-Scale Synthetic Dataset for Multi-Instance Image Generation with Detailed Annotation
  • 许可证: MIT
  • 任务类别: 文本到图像、图像到图像
  • 语言: 英语
  • 标签: 艺术
  • 规模: 100K<n<1M

数据集简介

IMIG-100K 是一个为多实例图像生成任务设计的大规模合成数据集。它包含超过 100,000 个高质量图像样本,每个样本都标注了掩码和布局信息。该数据集按不同难度级别组织成若干个子数据集。

子数据集与结构

IMIG-100K 数据集分为以下子数据集:

IMIG-Basic

  • 内容: 包含从合成图像衍生出的、实例较少的图像。
  • 特点: 参考图像与其在合成图像中的对应实例高度相似,适用于基础的多实例生成任务。

IMIG-Complex

  • 内容: 包含实例更多、复杂性更高的图像。
  • 特点: 该集合中的参考图像相对于其在合成图像中的对应实例发生了更显著的变换,为多实例生成模型提供了更大的挑战。

IMIG-Composite

  • 内容: 包含通过组合多个参考图像创建的合成图像。
  • 特点: 提供对齐的人脸图像以促进与人脸相关的生成任务。该集合中的实例将更灵活地从参考图像中组合而成。

数据集文件结构

解压后的数据集组织如下:

IMIG-100K/ ├── imig-basic/ │ ├── data/ │ ├── instance_data/ │ ├── masked_instance_data/ │ ├── kontext_data/ │ ├── masked_kontext_data/ │ ├── prompts.json │ ├── prompts_with_valid_bboxes.json │ └── filtered_prompts.json ├── imig-complex/ ├── imig-composite/ │ ├── reference_images/ │ ├── reference_masks/ │ ├── instance_masks/ │ ├── composite_images/ │ ├── aligned_faces/ │ ├── prompts.json │ ├── prompts_with_bboxes.json │ └── filtered_prompts.json └── imig-multicomposite/

快速开始

  • 使用提供的脚本 scripts/unpack_shards.py 解压分片。
  • 可根据主仓库中的对应代码自定义数据加载器。
  • 如需重新组织或过滤数据集,可参考数据集构建仓库。

引用

如果 IMIG-100K 对您的研究有帮助,请考虑引用我们的论文: bibtex @article{xu2025contextgencontextuallayoutanchoring, title={ContextGen: Contextual Layout Anchoring for Identity-Consistent Multi-Instance Generation}, author={Ruihang Xu and Dewei Zhou and Fan Ma and Yi Yang}, year={2025}, eprint={2510.11000}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2510.11000}, }

相关资源链接

  • GitHub 代码: https://github.com/nenhang/ContextGen
  • 项目主页: https://nenhang.github.io/ContextGen
  • 论文: https://arxiv.org/abs/2510.11000
  • 数据集代码: https://github.com/nenhang/IMIG-Source
  • 模型: https://huggingface.co/ruihangxu/ContextGen
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,多实例图像生成任务对高质量、结构化的训练数据提出了迫切需求。IMIG-100K数据集通过系统性的合成方法构建而成,其核心流程涉及利用先进的生成模型与精心设计的布局算法,自动创建超过十万张包含多个独立实例的高质量图像。每一张合成图像均伴随精确的实例掩码与布局坐标注释,并通过难度分级策略,将数据划分为基础、复杂与复合三个子集,从而构建出一个层次分明、标注详尽的大规模基准。
使用方法
对于致力于多实例图像生成的研究者而言,IMIG-100K提供了清晰的使用路径。用户首先需利用配套脚本解压分片数据,随后可按照解压后的标准目录结构访问各子集。数据集的组织方式便于用户根据任务需求,灵活调用原始图像、实例图像、掩码及文本提示等不同模态的数据。研究者可参考官方提供的代码库定制数据加载器,或依据数据集构建仓库的指引,对数据进行重组与筛选,以适配特定的模型训练与评估流程。
背景与挑战
背景概述
在计算机视觉与生成式人工智能领域,多实例图像生成旨在从多个参考图像中合成包含多个目标实例的复合场景,对内容可控的图像合成至关重要。IMIG-100K数据集由浙江大学ReLER和CCAI实验室的研究团队于2025年构建,核心研究人员包括徐瑞航、周德伟、马凡和杨轶。该数据集针对多实例生成任务中身份一致性与布局控制的难题,提供了超过十万个高质量合成样本,每个样本均附有掩码和布局标注。通过构建基础、复杂与复合三个子集,IMIG-100K系统性地涵盖了从简单到困难的生成场景,为推动可控图像生成模型的训练与评估提供了关键资源。
当前挑战
多实例图像生成的核心挑战在于如何确保生成图像中每个实例的身份特征与参考图像保持一致,同时精确控制多个实例在复杂场景中的空间布局与相互关系。IMIG-100K旨在解决这一领域问题,其构建过程亦面临多重困难:一方面,需要大规模合成视觉逼真且标注详尽的高质量图像数据,涉及实例分割、对齐与组合的自动化流程设计;另一方面,数据集的层次化结构要求对不同难度级别的样本进行合理定义与划分,以确保其能够有效驱动模型处理从基础到复杂的生成任务,这对数据生成管道的可靠性与泛化能力提出了较高要求。
常用场景
经典使用场景
在计算机视觉与生成式人工智能领域,多实例图像生成任务旨在从多个参考图像中合成包含多个目标实例的复合图像。IMIG-100K数据集为此提供了大规模、高质量的训练与评估基准。其经典使用场景集中于训练和验证先进的文本到图像或图像到图像生成模型,特别是那些需要精确控制多个实例外观、布局及身份一致性的模型。通过其结构化的子数据集,研究者能够系统评估模型在从简单到复杂的多实例组合场景下的生成能力与鲁棒性。
解决学术问题
该数据集有效解决了多实例生成研究中长期存在的若干关键问题。首要贡献在于提供了大规模、带有精确掩码与布局标注的合成数据,缓解了该领域高质量标注数据稀缺的困境。其细致的实例与复合图像配对,以及不同难度层级的划分,为量化评估模型在身份一致性、实例间关系建模以及复杂场景理解方面的性能提供了标准化的测试平台。这显著推动了可控图像生成、场景构图以及跨实例属性迁移等核心学术方向的发展。
实际应用
超越纯学术探索,IMIG-100K数据集在诸多实际应用场景中展现出重要价值。在创意设计与数字内容创作领域,它能够赋能工具生成包含特定人物或物品的复杂宣传海报或概念艺术图。在电子商务中,可用于合成展示多款商品在特定环境下的搭配效果图。此外,其人脸对齐子数据集也为个性化头像生成、虚拟试妆等身份保持性应用提供了宝贵的数据资源,促进了生成式AI技术向产品化与实用化的转化。
数据集最近研究
最新研究方向
在生成式人工智能领域,多实例图像生成任务正逐渐成为研究热点,其核心挑战在于保持多个对象身份一致性的同时实现复杂场景的合成。IMIG-100K数据集凭借其大规模合成特性与精细的掩码及布局标注,为这一方向提供了关键支撑。当前研究聚焦于利用该数据集的结构化子集,探索基于上下文布局锚定的生成模型,旨在提升模型在复杂实例变换下的身份保持能力。相关进展与扩散模型的架构创新紧密结合,推动了可控图像生成技术在艺术创作和虚拟内容制作等场景的应用深化,为多对象交互生成奠定了新的基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作