FashionStylist

Name: FashionStylist
Creator: 燕山大学; 中南大学; 浙江大学; 西南大学; 新加坡管理大学; 新加坡科技设计大学
Published: 2026-04-13 17:14:45
License: 暂无描述

arXiv2026-04-13 更新2026-04-14 收录

下载链接：

https://github.com/recsys-benchmark/FashionStylist

下载链接

链接失效反馈

官方服务：

资源简介：

FashionStylist是由时尚领域专家团队构建的多模态基准数据集，旨在支持专业级时尚理解。该数据集包含2,239套完整穿搭，涵盖男女装及童装，并整合了服饰单品图像、分层搭配、配饰等真实场景元素，数据来源于淘宝和得物电商平台。通过九人专家团队的标准化标注流程，数据集提供了单品属性（如材质、廓形）和穿搭层级（如风格、场合）的双重语义标注。其创新性在于融合视觉感知与专家知识，支持穿搭单品定位、搭配补全和语义评估三大任务，为提升多模态大模型在时尚领域的推理能力提供了结构化知识基础。

FashionStylist is a multimodal benchmark dataset constructed by a team of fashion domain experts, aimed at supporting professional-grade fashion understanding. It contains 2,239 complete outfits covering men's, women's and children's apparel, and integrates real-world scene elements such as clothing item images, layered matching combinations and accessories. The data is sourced from Taobao and Dewu e-commerce platforms. Through a standardized annotation process implemented by a nine-member expert team, the dataset provides dual semantic annotations for clothing item attributes (e.g., material, silhouette) and outfit hierarchies (e.g., style, occasion). Its core innovation lies in the integration of visual perception and expert domain knowledge, which supports three major tasks: clothing item localization, outfit matching completion and semantic evaluation. This dataset serves as a structured knowledge foundation to improve the reasoning capabilities of multimodal large language models in the fashion domain.

提供机构：

燕山大学; 中南大学; 浙江大学; 西南大学; 新加坡管理大学; 新加坡科技设计大学

创建时间：

2026-04-10

原始信息汇总

FashionStylist 数据集概述

数据集基本信息

数据集名称：FashionStylist
核心描述：一个专家知识增强的多模态时尚数据集，用于套装级和单品级的时尚理解。
版本：V1
语言版本：中文与英文
发布日期：2026年4月1日（V1），2026年4月8日（英文版）

数据规模与子集

数据集共包含 1,000 个套装级条目和 4,637 个单品级标注，分为三个子集：

Female（女性）：500套服装，2,406个单品
Male（男性）：300套服装，1,390个单品
Child（儿童）：200套服装，841个单品

数据结构与文件组织

数据集文件按子集（Female、Male、Child）组织，每个子集包含以下文件：

look*.csv / look_en.csv：套装级标注文件
label*.csv / label_en.csv：单品级标注文件

标注模式详情

套装级标注 (`look*.csv` / `look_en.csv`)

outfitID：套装标识符
items：属于该套装的单品标识符列表（逗号分隔）
look：自由格式的套装描述
season：标准化季节标签，共6类：春/Spring、夏/Summer、秋/Autumn、冬/Winter、春夏/Spring/Summer、秋冬/Autumn/Winter
occasion：标准化场合标签，包含7个基础类（运动/Sports、出行/Travel、日常/Daily、校园/School、社交/Social、商务/Business、居家/Home）及其斜杠分隔的组合（例如日常/出行、运动/出行）
URL link：来源产品或风格参考链接（仅中文版）

单品级标注 (`label*.csv` / `label_en.csv`)

itemID：单品标识符
category：单品类别（仅英文版）：outerwear、mid_layer_top、inner_top、bottom、shoes、bag、accessory、onepiece
title：单品标题
gender：目标性别群体
style：风格标注
outline：廓形/轮廓
materials：材质标注
color：颜色标注
pattern：图案标注
detail：设计细节标注
donning/doffing：穿着或脱卸方式
URL link：来源产品链接（仅中文版）

支持的研究任务

数据集支持以下研究方向：

套装理解
单品属性识别
时尚描述定位
跨模态检索
多模态推理

基准测试

基准测试和评估代码针对三个任务提供：

Task 1 — Outfit2item Grounding
Task 2 — Outfit Completion
Task 3 — Outfit Evaluation 代码位于 Benchmark/ 目录下。

补充材料

实验基线设置和所有使用的提示词均在 Supplementary_material.pdf 文件中提供。

未来计划

计划发布 FashionStylist V2，一个更大规模的数据集版本。

搜集汇总

数据集介绍

构建方式

在时尚理解领域，现有数据集往往局限于单品属性或搭配共现关系，难以支撑对整体造型的语义理解。FashionStylist的构建采用了专业驱动的标注流程，从淘宝和得物两大电商平台采集了涵盖男装、女装和童装的原始数据，经过多阶段清洗与标准化处理，确保每个造型与构成单品间的完整关联。核心环节是由九位时尚领域专家组成的团队进行双重标注：在单品层面，标注了轮廓、材质、图案等细粒度属性；在造型层面，则提供了风格描述、季节适宜性和场合适用性等专业语义注释。整个流程通过交叉评审与一致性验证，最终形成了包含1000个造型样本和4637个单品样本的高质量数据集。

使用方法

FashionStylist支持三种渐进式的研究任务，形成从感知到推理的完整评估体系。在造型到单品定位任务中，模型需根据整体造型图像和单品类别描述，生成对应的单品图像，考验对复杂造型中遮挡元素的分解能力。造型补全任务要求模型在给定部分单品的情况下，从候选池中选择语义兼容的缺失单品，评估其跨单品协调推理能力。造型评估任务则直接检验模型的专业判断水平，需要预测造型的风格、季节与场合，并识别风格不一致的单品。这些任务可分别通过图像编辑模型、检索或生成式推荐系统以及多模态大语言模型来实施，数据集中对齐的单品与造型级标注为模型训练提供了丰富的监督信号。

背景与挑战

背景概述

时尚理解作为多媒体研究的重要应用领域，其核心在于对完整穿搭造型的视觉感知与语义理解的联合建模。然而，现有数据集多专注于单品属性识别或基于共现的搭配推荐，难以支撑对穿搭整体风格、场合适宜性及搭配逻辑的专家级语义理解。为此，由燕山大学、中南大学、浙江大学、西南大学及新加坡管理大学等多所机构的研究人员于2026年共同构建了FashionStylist数据集。该数据集通过专业的时尚专家标注流程，首次在单品与穿搭两个层面提供了系统化的专家知识标注，旨在解决现有数据在支持整体穿搭理解方面的局限性，为基于多模态大语言模型的时尚系统提供统一的评估基准与训练资源。

当前挑战

FashionStylist旨在解决的领域挑战在于实现专家级的整体时尚理解，这超越了传统的单品分类或搭配共现匹配。具体任务挑战包括：在复杂的现实穿搭场景（涉及配饰、叠穿）中实现从穿搭到单品的精准视觉定位；在考虑风格、季节、场合等多维语义兼容性的前提下完成穿搭补全；以及对穿搭的整体风格、季节适配性、场合适宜性及协调性进行专家级评估。在构建过程中，主要挑战源于高质量专家标注的获取，包括设计覆盖单品物理属性与穿搭整体语义的双层标注体系、确保标注词汇的一致性与标准化，以及在包含叠穿、配饰的真实复杂穿搭中建立可靠的单品-穿搭关联，这些都对标注流程的专业性与严谨性提出了极高要求。

常用场景

经典使用场景

在时尚多媒体研究领域，FashionStylist数据集最经典的应用场景体现在其作为统一基准测试平台的角色。该数据集通过专业时尚专家标注流程构建，同时提供单品层面和整体穿搭层面的结构化语义注释，支持从感知到推理的多层次任务评估。研究者在开发基于多模态大语言模型的时尚理解系统时，通常利用该数据集进行模型训练与验证，特别是在处理包含配饰、叠穿等复杂现实穿搭场景时，能够有效评估模型在视觉感知与语义理解方面的综合能力。

解决学术问题

FashionStylist数据集主要解决了时尚计算领域长期存在的三个关键学术问题。首先，它弥合了单品级感知与穿搭级语义理解之间的鸿沟，通过专家标注的风格、季节、场合等高层语义标签，使模型能够超越表面共现模式进行深层次推理。其次，该数据集突破了传统数据集在复杂穿搭场景建模上的局限，通过包含配饰、叠穿等真实元素，为研究遮挡恢复、多层次协调等挑战性问题提供了数据基础。最后，它首次系统性地支持穿搭评估任务，为衡量模型是否真正理解时尚语义而非仅学习外观模式提供了标准化评估框架。

实际应用

在实际应用层面，FashionStylist数据集为多个时尚智能系统提供了关键支撑。在个性化穿搭推荐场景中，基于该数据集训练的模型能够综合考虑单品属性与整体穿搭语义，生成风格一致且场合适宜的搭配方案。在电商平台的视觉搜索功能中，其支持的穿搭到单品定位任务可帮助用户从复杂穿搭图片中精准识别并定位特定服饰单品。对于时尚设计辅助工具，数据集提供的专家级评估能力可用于自动分析穿搭的风格协调性与场景适配度，为设计师提供数据驱动的决策参考。

数据集最近研究