FashionEdit

Name: FashionEdit
Creator: 香港理工大学,中国; 中国石油大学（华东）,中国
Published: 2025-09-11 18:14:36
License: 暂无描述

arXiv2025-09-11 更新2025-11-24 收录

下载链接：

https://github.com/detectiveli/FashionEdit

下载链接

链接失效反馈

官方服务：

资源简介：

FashionEdit数据集是一个模拟真实世界服装设计工作流程的时尚数据集，用于评估基于图像到提示的细粒度定制服装设计。数据集由香港理工大学和中国石油大学（华东）的研究人员创建，包含从DeepFashion-MultiModal数据集生成的11546张图像及其与原始图像的差异，差异包括描述和从原始图像中裁剪的区域。数据集旨在解决当前生成式AI模型在服装设计定制化方面存在的文本描述模糊问题，通过结合文本提示和图像提示进行迭代图像编辑，以提高用户满意度和设计质量。

The FashionEdit Dataset is a fashion dataset that simulates real-world clothing design workflows, dedicated to evaluating image-to-prompt based fine-grained customized clothing design. It was created by researchers from The Hong Kong Polytechnic University and China University of Petroleum (East China). The dataset contains 11,546 images generated from the DeepFashion-MultiModal dataset, along with their differences from the original images, which include descriptive annotations and cropped regions extracted from the original images. This dataset aims to address the issue of vague text descriptions in current generative AI models for customized clothing design, and enables iterative image editing by combining both text prompts and image prompts to improve user satisfaction and design quality.

提供机构：

香港理工大学,中国; 中国石油大学（华东）,中国

创建时间：

2025-09-11

搜集汇总

数据集介绍

构建方式

在服装设计智能化转型的背景下，FashionEdit数据集通过系统化流程构建而成。该数据集基于DeepFashion-MultiModal原始数据，首先采用SD3模型将文本描述转化为初始设计图像，并通过CLIP相似度筛选出11,546张高质量图像。随后利用GPT4.1-mini分析生成图像与原始图像的差异，自动提取前三位差异区域的文本描述与坐标信息，形成包含图文双重指引的修改指令对。

使用方法

在时尚生成模型评估体系中，该数据集支持多维度的性能验证。研究者可通过文本-图像联合提示机制驱动模型进行迭代式设计修改，利用CLIP指标衡量生成相似度，CLIP*评估用户满意度，PSNR检验图像质量。数据集的层次化结构允许分别测试模型在草图转化、细节还原、样例迁移等场景下的表现，为改进生成式AI的细粒度控制能力提供基准平台。

背景与挑战

背景概述

FashionEdit数据集由香港理工大学与华东石油大学的研究团队于2025年提出，聚焦于生成式人工智能在服装设计领域的精细化定制问题。该数据集基于DeepFashion-MultiModal构建，通过引入图像转提示技术，解决了传统文本描述在传达专业设计细节时的模糊性局限。其核心创新在于结合大型多模态模型，实现了从用户对话到服装设计的端到端生成流程，显著推动了人工智能在时尚产业个性化定制中的应用边界。

当前挑战

该数据集主要应对两大挑战：在领域问题层面，需突破文本描述不确定性对服装精细化设计的限制，例如领型、纽扣布局等细节难以通过语言精确传达；在构建过程中，面临生成图像与真实设计差异的量化分析难题，需通过多轮迭代编辑与跨模态对齐技术，确保生成结果在语义相似度、用户满意度及视觉质量等维度达到工业级标准。

常用场景

经典使用场景

在时尚设计领域，FashionEdit数据集主要应用于细粒度定制化服装生成场景。该数据集通过结合文本描述与参考图像，模拟真实世界设计师根据客户提供的草图、细节图或样例图像进行多轮迭代修改的过程。其经典使用方式体现在利用大型多模态模型分析服装的局部差异，实现从领口样式到纽扣排列等微观元素的精准控制，为生成式AI在时尚产业中的复杂工作流提供了标准化测试平台。

解决学术问题

该数据集有效解决了生成式AI在时尚设计领域面临的两个核心学术问题：一是纯文本描述存在的语义模糊性难题，通过引入图像提示机制增强模型对专业设计细节的理解能力；二是多轮迭代编辑中的语义一致性保持问题，其提出的BUG工作流通过跨模态对齐技术显著提升了设计修改的准确度。这些突破为多模态生成模型在专业领域的细粒度控制提供了新的方法论支撑。

实际应用

在实际应用层面，FashionEdit为服装产业的数字化转型提供了关键技术支持。时尚品牌可利用该数据集训练的模型构建智能设计系统，使消费者能够通过上传参考图像直接参与服装定制过程。制造业者则能基于其迭代编辑能力快速生成符合客户需求的样衣设计，大幅缩短从概念到实物的转化周期，同时降低对专业设计师的依赖程度，推动个性化定制服务的规模化发展。

数据集最近研究