IMIG-100K
收藏IMIG-100K 数据集概述
数据集基本信息
- 名称: IMIG-100K: A Large-Scale Synthetic Dataset for Multi-Instance Image Generation with Detailed Annotation
- 许可证: MIT
- 任务类别: 文本到图像、图像到图像
- 语言: 英语
- 标签: 艺术
- 规模: 100K<n<1M
数据集简介
IMIG-100K 是一个为多实例图像生成任务设计的大规模合成数据集。它包含超过 100,000 个高质量图像样本,每个样本都标注了掩码和布局信息。该数据集按不同难度级别组织成若干个子数据集。
子数据集与结构
IMIG-100K 数据集分为以下子数据集:
IMIG-Basic
- 内容: 包含从合成图像衍生出的、实例较少的图像。
- 特点: 参考图像与其在合成图像中的对应实例高度相似,适用于基础的多实例生成任务。
IMIG-Complex
- 内容: 包含实例更多、复杂性更高的图像。
- 特点: 该集合中的参考图像相对于其在合成图像中的对应实例发生了更显著的变换,为多实例生成模型提供了更大的挑战。
IMIG-Composite
- 内容: 包含通过组合多个参考图像创建的合成图像。
- 特点: 提供对齐的人脸图像以促进与人脸相关的生成任务。该集合中的实例将更灵活地从参考图像中组合而成。
数据集文件结构
解压后的数据集组织如下:
IMIG-100K/ ├── imig-basic/ │ ├── data/ │ ├── instance_data/ │ ├── masked_instance_data/ │ ├── kontext_data/ │ ├── masked_kontext_data/ │ ├── prompts.json │ ├── prompts_with_valid_bboxes.json │ └── filtered_prompts.json ├── imig-complex/ ├── imig-composite/ │ ├── reference_images/ │ ├── reference_masks/ │ ├── instance_masks/ │ ├── composite_images/ │ ├── aligned_faces/ │ ├── prompts.json │ ├── prompts_with_bboxes.json │ └── filtered_prompts.json └── imig-multicomposite/
快速开始
- 使用提供的脚本
scripts/unpack_shards.py解压分片。 - 可根据主仓库中的对应代码自定义数据加载器。
- 如需重新组织或过滤数据集,可参考数据集构建仓库。
引用
如果 IMIG-100K 对您的研究有帮助,请考虑引用我们的论文: bibtex @article{xu2025contextgencontextuallayoutanchoring, title={ContextGen: Contextual Layout Anchoring for Identity-Consistent Multi-Instance Generation}, author={Ruihang Xu and Dewei Zhou and Fan Ma and Yi Yang}, year={2025}, eprint={2510.11000}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2510.11000}, }
相关资源链接
- GitHub 代码: https://github.com/nenhang/ContextGen
- 项目主页: https://nenhang.github.io/ContextGen
- 论文: https://arxiv.org/abs/2510.11000
- 数据集代码: https://github.com/nenhang/IMIG-Source
- 模型: https://huggingface.co/ruihangxu/ContextGen




