Per-400k
收藏Hugging Face2025-05-22 更新2025-05-23 收录
下载链接:
https://huggingface.co/datasets/a1557811266/Per-400k
下载链接
链接失效反馈官方服务:
资源简介:
Per-400k数据集是一个用于训练生成与参考人物外观和着装一致的新图像的数据集。它包含470,664对人物图像,每对图像由一个原始图像和两个子图像(左和右)组成,这些子图像中的主要人物相同,但可能在不同的背景或进行不同的活动。每个图像对还包含相对提示,描述了左右子图像之间的差异。
创建时间:
2025-05-21
原始信息汇总
Per-400k 数据集概述
数据集简介
- 目的:用于训练生成人物一致图像的模型,即根据参考人物图像生成相同个体(相同服装和外观)在不同背景或活动中的新图像。
- 数据量:包含470,664对人物图像,共941,328个训练三元组。
数据结构
JSON文件中的每个条目为字典结构,包含以下键:
| 键名 | 描述 |
|---|---|
image_path |
原始生成图像的相对路径。 |
image_path_left |
从原始图像裁剪/分割的左子图像的相对路径。 |
image_path_right |
从原始图像裁剪/分割的右子图像的相对路径。 |
Right Relative Prompt |
描述右子图像相对于左子图像的提示文本(不重复左子图像已显示的信息)。 |
Left Relative Prompt |
描述左子图像相对于右子图像的提示文本(不重复右子图像已包含的细节)。 |
数据特点
- 左右子图像包含相同的主要人物(相同的服装和外观),但背景或人物活动可能不同。
- 提示文本采用相对描述方式,避免信息重复。
示例条目
json { "image_path": "person_data/img/0-1.png", "image_path_left": "person_data/sub_img/img_left/0_1_left.jpg", "image_path_right": "person_data/sub_img/img_right/0_1_right.jpg", "Right Relative Prompt": "He is setting up a tent at the campground, with trees in the background.", "Left Relative Prompt": "This lad is sitting by a campfire at a campground, looking into the flames." }
使用场景
- 主要用途:训练条件性人物图像生成模型,确保生成人物与参考图像的外观和服装匹配,同时允许背景或活动变化。
- 每个图像对及其关联的相对提示构成训练三元组。
许可信息
- 许可证类型:Apache-2.0
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,人物一致性图像生成任务对高质量数据提出了迫切需求。Per-400k数据集通过系统化流程构建,首先生成包含特定人物的原始图像,随后将每张图像分割为左右两个子图像区域。关键创新在于为每对子图像精心设计了相对提示文本,这些文本专门描述另一子图像未呈现的视觉特征差异,最终形成包含47万对图像和94万组训练三元组的标准化数据集。
特点
该数据集最显著的特征在于其独特的相对提示机制,每个提示文本仅描述对应子图像相对于另一子图像的差异化内容,有效避免了信息冗余。所有图像对均保持相同人物的外观特征与服装细节,仅在背景环境或人物动作层面呈现可控变化。这种精心设计的对比结构为模型学习人物特征解耦与场景迁移提供了理想的数据基础。
使用方法
研究人员在使用该数据集时,需先通过配套的Python解压脚本处理分布式存储的图像压缩包。数据加载过程中应重点关注图像路径与相对提示文本的对应关系,建议采用端到端的训练范式,将参考图像与相对提示作为条件输入,引导模型生成符合要求的目标图像。这种使用方法能充分发挥数据集在人物保持与场景变换任务上的独特优势。
背景与挑战
背景概述
随着生成式人工智能在计算机视觉领域的迅猛发展,人物图像生成技术逐渐成为研究热点。Per-400k数据集应运而生,专门用于训练能够生成人物一致性图像的模型。该数据集由研究团队在近期构建,旨在解决给定参考人物图像后生成具有相同服饰与外貌、但背景或活动各异的新图像这一核心问题。通过提供47万组人物图像对及对应的相对描述文本,该数据集为人物图像生成任务提供了大规模训练资源,显著推动了可控图像生成领域的发展。
当前挑战
在人物图像生成领域,确保生成图像中人物身份、服饰等细节的一致性始终是关键技术难题。Per-400k数据集通过构建包含相同人物但不同场景的图像对,直接应对这一挑战。数据构建过程中,团队需克服生成图像质量与多样性的平衡问题,同时保证左右子图像间描述文本的相对性与互补性。此外,处理海量图像数据时的存储与高效提取亦构成实际挑战,需设计自动化流程以支持大规模应用。
常用场景
实际应用
在实际应用层面,Per-400k数据集支撑的模型技术已广泛应用于虚拟试衣、影视特效制作和数字人创作等领域。电商平台可利用该技术实现商品展示的个性化定制,娱乐产业则能快速生成角色在不同场景下的连贯影像。这些应用显著提升了内容生产的效率与质量。
衍生相关工作
基于Per-400k数据集的研究已催生多项重要成果,包括人物属性保持的生成对抗网络、跨场景的人物图像转换模型等。这些工作不仅拓展了条件图像生成的技术边界,还为相关领域提供了可复现的基准方法。数据集的结构设计理念也启发了后续多模态数据集的建设思路。
以上内容由遇见数据集搜集并总结生成



