GarmentBench

Name: GarmentBench
Creator: 南京理工大学
Published: 2025-04-18 01:59:47
License: 暂无描述

arXiv2025-04-18 更新2025-04-19 收录

下载链接：

https://github.com/muzishen/IMAGGarment-1

下载链接

链接失效反馈

官方服务：

资源简介：

GarmentBench是一个大规模的数据集，包含超过18万件服装样本，每个样本都配有多级设计条件，包括草图、颜色参照、标志放置和文本提示。该数据集由南京理工大学的研究团队发布，旨在支持细粒度服装生成任务的研究，为可控时尚设计提供精细的服装合成支持。

GarmentBench is a large-scale dataset consisting of over 180,000 garment samples, each equipped with multi-level design conditions including sketches, color references, logo placement, and text prompts. It was released by a research team from Nanjing University of Science and Technology, aiming to support research on fine-grained garment generation tasks and provide precise garment synthesis support for controllable fashion design.

提供机构：

南京理工大学

创建时间：

2025-04-18

搜集汇总

数据集介绍

构建方式

GarmentBench数据集的构建采用了多阶段精细化流程，通过YOLOv8模型对189K原始服装图像进行检测与裁剪，消除背景干扰。随后利用Qwen-VL-Chat多模态大模型生成文本描述，采用InformativeDrawings算法提取结构草图，并基于ResNet50与K-means聚类提取单色服装的色板。针对标志控制需求，通过目标检测定位视觉显著区域后经人工校验，最终形成包含轮廓草图、色彩参考、空间位置掩码等多模态标注的18.9万样本集。

使用方法

使用该数据集时建议采用两阶段训练策略：首先利用全局外观模型处理轮廓与色彩条件，通过混合注意力模块实现空间对齐；随后通过局部增强模型的A3模块注入标志特征。评估时可采用五维度指标体系，其中FID衡量整体真实性，LPIPS评估结构相似度，CSS检验色彩一致性，LLA量化标志位置精度，CLIPScore验证语义对齐。需注意输入图像应统一缩放至512×640分辨率，并在潜在空间进行通道维度的条件拼接。

背景与挑战

背景概述

GarmentBench是由南京理工大学和南京大学的研究团队于2025年发布的细粒度服装生成数据集，旨在推动可控时尚设计领域的研究。该数据集包含超过18万件服装样本，每件样本均配有丰富的多层级设计条件标注，包括轮廓草图、色彩参考、标志位置及文本描述。作为IMAGGarment-1框架的核心支撑，GarmentBench首次系统性地解决了传统服装生成任务中单条件输入的局限性，为同时控制服装结构、色彩和局部细节提供了标准化基准。其创新性的多模态标注体系显著提升了生成模型在语义一致性、空间精度和视觉保真度方面的性能，已成为数字服装合成领域的重要基础设施。

当前挑战

构建GarmentBench面临三大核心挑战：在领域问题层面，需突破传统单条件生成模型的局限，解决轮廓、色彩与标志等多条件协同控制时的语义冲突问题；在数据构建层面，需要精确标注服装结构语义与局部细节的空间对应关系，这对标注一致性与细粒度划分提出极高要求；在技术实现层面，标志位置标注需平衡人工验证效率与空间定位精度，而跨模态对齐则需克服文本描述与视觉特征间的语义鸿沟。这些挑战使得数据集的构建过程需要融合计算机视觉、时尚设计等多领域专业知识。

常用场景

经典使用场景

在时尚设计与数字服装领域，GarmentBench数据集被广泛应用于细粒度服装生成任务。该数据集通过整合多模态设计条件，如文本描述、轮廓草图、色彩参考和标志位置，为研究人员提供了一个可控且可扩展的基准平台。其经典使用场景包括基于多条件输入的服装图像合成，其中生成模型需同时满足轮廓结构的精确对齐、色彩方案的高度还原以及标志元素的准确空间布局。这种细粒度控制能力使得设计师能够快速迭代创意方案，同时为学术研究提供了验证生成模型可控性的标准化环境。

解决学术问题

GarmentBench数据集有效解决了服装生成领域多个关键学术问题。传统方法依赖单一条件输入，导致生成结果在结构与细节上缺乏协调性，而该数据集通过提供丰富的多级标注，支持全局属性与局部特征的解耦建模。其意义在于首次实现了轮廓、色彩与标志空间位置的三元协同控制，为多条件生成中的语义一致性冲突、视觉元素干涉等问题提供了数据基础。数据集的构建范式推动了生成模型从粗粒度到细粒度控制的范式转变，对个性化时尚设计、虚拟试衣等研究方向产生了深远影响。

实际应用

在实际应用层面，GarmentBench数据集显著提升了数字服装工作流的效率与精度。时尚设计师可通过调整草图轮廓实时生成多样化的服装款式，品牌定制系统利用色彩适配器模块实现企业VI色彩的精准复现，而电子商务平台则依托标志定位功能实现虚拟商品的动态贴图。该数据集特别适用于需要快速原型设计的场景，如时装周数字样衣制作、游戏角色服装生成等，其多条件控制特性可将传统数周的设计周期压缩至小时级，同时保持专业级视觉品质。

数据集最近研究