FashionStylist

github2026-04-09 更新2026-04-22 收录

下载链接：

https://github.com/recsys-benchmark/FashionStylist

下载链接

链接失效反馈

官方服务：

资源简介：

FashionStylist是一个专家知识增强的多模态时尚数据集，用于服装级别和单品级别的时尚理解。当前版本包含三个子集：女性（500套服装，2,406个单品）、男性（300套服装，1,390个单品）和儿童（200套服装，841个单品）。数据集支持服装理解、单品属性识别、时尚描述接地、跨模态检索和多模态推理等研究。

FashionStylist is a multi-modal fashion dataset enhanced with expert knowledge, designed for clothing-level and item-level fashion understanding. The current version of the dataset comprises three subsets: Female (500 outfits, 2,406 individual items), Male (300 outfits, 1,390 individual items), and Children (200 outfits, 841 individual items). This dataset supports research in clothing comprehension, item attribute recognition, fashion description grounding, cross-modal retrieval, and multi-modal reasoning.

创建时间：

2026-03-29

原始信息汇总

FashionStylist 数据集概述

数据集基本信息

数据集名称：FashionStylist
核心定位：一个专家知识增强的多模态时尚数据集，用于套装级和单品级的时尚理解。
版本：V1
语言版本：提供中文和英文版本。

数据规模与子集划分

当前版本共包含 1,000 个套装级条目 和 4,637 个单品级标注，并划分为三个子集：

Female（女性）：500 套服装，2,406 件单品。
Male（男性）：300 套服装，1,390 件单品。
Child（儿童）：200 套服装，841 件单品。

数据结构与文件组织

数据集文件按子集（Female/、Male/、Child/）组织，每个子集包含以下文件：

套装级标注文件：
- look(b1-*).csv：中文版套装数据。
- look_en.csv：英文版套装数据。
单品级标注文件：
- label(p1-*).csv：中文版单品数据。
- label_en.csv：英文版单品数据。

标注模式详解

套装级标注 (`look*.csv` / `look_en.csv`)

outfitID：套装标识符。
items：属于该套装的单品标识符列表（逗号分隔）。
look：自由格式的套装描述。
season：规范化的季节标签，共6类：春/Spring、夏/Summer、秋/Autumn、冬/Winter、春夏/Spring/Summer、秋冬/Autumn/Winter。
occasion：规范化的场合标签，包含7个基础类别（运动/Sports、出行/Travel、日常/Daily、校园/School、社交/Social、商务/Business、居家/Home）及其斜杠分隔的组合（例如 日常/出行、运动/出行）。
URL link：源产品或风格参考链接（仅中文版提供）。

单品级标注 (`label*.csv` / `label_en.csv`)

itemID：单品标识符。
category：单品类别（仅英文版提供）：outerwear、mid_layer_top、inner_top、bottom、shoes、bag、accessory、onepiece。
title：单品标题。
gender：目标性别群体。
style：风格标注。
outline：廓形/轮廓。
materials：材质标注。
color：颜色标注。
pattern：图案标注。
detail：设计细节标注。
donning/doffing：穿着或脱卸方式。
URL link：源产品链接（仅中文版提供）。

支持的研究任务

数据集支持以下研究方向：

套装理解
单品属性识别
时尚描述定位
跨模态检索
多模态推理

基准测试

在 Benchmark/ 目录下提供了三个任务的基准测试基线和评估代码：

任务 1：Outfit2item Grounding
任务 2：Outfit Completion
任务 3：Outfit Evaluation

发布与更新记录

2026年4月1日：发布 FashionStylist V1。
2026年4月8日：发布 FashionStylist 的英文版本。

补充材料

实验基线设置和所有提示词均提供在 Supplementary_material.pdf 文件中。

搜集汇总

数据集介绍

构建方式

在时尚理解领域，数据集的构建往往需要融合专业知识和多模态信息。FashionStylist数据集通过精心设计的标注框架，系统性地收集了涵盖女性、男性和儿童三个子集的时尚搭配数据。每个搭配均以套装为单位进行组织，并关联至对应的单品条目，形成了包含1000个套装级条目和4637个单品级标注的结构化集合。标注过程严格遵循预定义的语义规范，涵盖了季节、场合、风格、材质、色彩等多维度属性，确保了数据的丰富性与一致性。

特点

该数据集的核心特点在于其专家知识增强的多模态架构，不仅提供了中英文双语标注，还细致划分了性别特定的子集，以适应多样化的研究需求。套装级与单品级数据的紧密关联支持从整体搭配到局部细节的深入分析，而标准化的属性标签如季节、场合、品类等则为跨任务比较提供了可靠基础。此外，数据集还附带了基准测试代码，便于研究者直接应用于搭配理解、属性识别和跨模态检索等前沿任务。

使用方法

研究者可通过下载数据集文件，按性别子集分别访问套装描述和单品标注表格，利用唯一的标识符实现数据关联。数据集支持多种应用场景，例如基于文本描述定位搭配中的单品、完成不完整的时尚搭配，或评估搭配的整体协调性。基准目录中提供的任务代码可作为实验起点，用户可在此基础上拓展模型或开发新的评估指标，以推动时尚计算领域的创新。

背景与挑战

背景概述

FashionStylist数据集于2026年4月由研究团队发布，是一个融合专家知识的多模态时尚理解数据集。该数据集旨在推动服装搭配层面的智能分析，涵盖女装、男装和童装三大子集，共包含1000套搭配级条目与4637个单品级标注。其核心研究问题聚焦于如何通过结构化知识增强模型对时尚搭配的语义理解，支持包括搭配理解、单品属性识别、时尚描述定位、跨模态检索及多模态推理在内的多项任务。该数据集的构建为时尚计算领域提供了细粒度、多层次的标注资源，有望促进个性化推荐系统与智能时尚助手的发展。

当前挑战

在时尚理解领域，传统方法常面临搭配语义模糊与单品属性异构的挑战，FashionStylist致力于解决搭配级与单品级联合理解这一复杂问题。数据构建过程中，专家知识的融入需克服标注一致性与多维度属性标准化难题，例如季节、场合的归一化分类以及材质、廓形等细节的精确描述。同时，多语言版本（中英文）的同步发布要求跨文化语境下的语义对齐，确保标注在不同语言中保持逻辑一致。这些挑战共同指向了高质量时尚数据稀缺与多模态对齐的行业瓶颈。

常用场景

经典使用场景

在时尚计算领域，FashionStylist数据集为多模态时尚理解提供了结构化基准。其经典使用场景聚焦于服装搭配理解，通过整合套装级与单品级标注，支持模型学习从整体风格到细节属性的映射关系。研究者可基于此数据集开发算法，实现从自然语言描述到具体服装单品的精准定位，或评估不同单品在特定季节、场合下的搭配合理性，从而推动智能时尚推荐系统的演进。

实际应用

在实际应用层面，FashionStylist数据集能够赋能智能时尚助手与电子商务平台。基于其丰富的标注信息，可构建自动化的服装搭配推荐引擎，根据用户输入的场景或风格描述生成个性化着装方案。此外，在虚拟试衣、时尚内容生成及在线零售的商品搜索优化中，该数据集提供的多模态关联数据有助于提升系统理解与匹配的准确性，为用户提供更直观、专业的时尚服务体验。

衍生相关工作

围绕FashionStylist数据集，已衍生出多项经典研究工作，主要集中在多模态时尚理解任务上。例如，基于其基准任务开发的Outfit2item Grounding模型，实现了文本描述到服装单品的视觉定位；Outfit Completion研究则探索了不完整搭配的补全算法。这些工作借鉴或扩展了如CIRP、DiFashion等开源项目的技术思路，共同推动了搭配推理、跨模态检索等方向的算法创新与性能提升。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集