fashionrec-amz-mapper-50-50-sft

Hugging Face2026-06-30 更新2026-07-01 收录

下载链接：

https://huggingface.co/datasets/flavianv/fashionrec-amz-mapper-50-50-sft

下载链接

链接失效反馈

官方服务：

资源简介：

DeepShopper Mapper SFT 数据集是一个性别平衡（50/50）的数据集，专门用于时尚推荐系统中的搭配映射任务。该数据集包含10,000个样本，旨在训练模型根据用户需求生成完整的服装搭配方案。每个数据样本采用“需求 → {搭配物品数量, 推理过程, 搭配列表:[{物品角色, 检索查询}]}”的格式。其中，推理过程和每个搭配物品槽位的具体检索查询是通过单次调用Qwen3-32B大语言模型生成的。数据集的构建遵循性别平衡原则，由5,000个来自FashionRec-female（分布外数据）的样本和5,000个来自AMZ-male（分布内数据）的样本合并而成。它由两个现有数据集（fashionrec-task1-retrieval-mapper-sft和apparel23-bundle-retrieval-mapper-sft）组合构建，主要用于训练文本生成模型，以完成从抽象需求到具体、可检索的时尚单品搭配的映射任务，适用于时尚推荐、个性化搭配生成等应用场景。

The DeepShopper Mapper SFT dataset is a gender-balanced (50/50) dataset specifically designed for outfit mapping tasks in fashion recommendation systems. It contains 10,000 samples aimed at training models to generate complete clothing outfit plans based on user needs. Each data sample follows the format need → {number of outfit items, reasoning process, outfit list:[{item role, retrieval query}]}. The reasoning process and specific retrieval queries for each outfit item slot are generated through a single call to the Qwen3-32B large language model. The dataset is constructed following gender balance principles, combining 5,000 samples from FashionRec-female (out-of-distribution data) and 5,000 samples from AMZ-male (in-distribution data). It is built by combining two existing datasets (fashionrec-task1-retrieval-mapper-sft and apparel23-bundle-retrieval-mapper-sft) and is primarily used to train text generation models for mapping abstract needs to specific, retrievable fashion item outfits, applicable in scenarios such as fashion recommendation and personalized outfit generation.

创建时间：

2026-06-29

原始信息汇总

数据集概述：DeepShopper Mapper SFT — gender-balanced 50/50

数据集名称: DeepShopper Mapper SFT — gender-balanced 50/50
许可证: 其他（other）
语言: 英语（en）
任务类别: 文本生成（text-generation）
标签: deepshopper, recommendation, fashion, outfit

数据内容与结构

训练数据格式: need → {num_items, reasoning, outfit:[{role, query}]}
- 输入为“需求”，输出包含物品数量、推理过程以及由多个角色-查询对组成的搭配方案。
数据规模: 10,000 行
性别平衡: 5,000 行来自 FashionRec 女性数据（OOD，域外）+ 5,000 行来自 AMZ 男性数据（in-distribution，域内）

数据生成

每个搭配的推理过程与每个槽位的检索查询由单次 Qwen3-32B 调用生成。

构建来源

基于两个数据集构建：
- fashionrec-task1-retrieval-mapper-sft
- apparel23-bundle-retrieval-mapper-sft

用途

用于训练模型 flavianv/qwen4b-mapper-50-50-regen-sft

相关代码

代码仓库：https://github.com/clijo/reco-rl（分支：outfit_bundle）

搜集汇总

数据集介绍

构建方式

该数据集基于DeepShopper框架构建，旨在通过监督微调（SFT）训练一个映射器（Mapper）模型。其构建过程始于从两个来源抽取数据：FashionRec数据集的女性子集（5,000条，作为分布外样本）和AMZ数据集的男性子集（5,000条，作为分布内样本），最终形成一个性别平衡（50/50）的10,000条样本集合。每条样本对应一套服装搭配（outfit），通过调用Qwen3-32B大语言模型进行单次生成，同时产出推理过程（reasoning）和每个槽位（slot）的检索查询（query），进而将用户需求（need）映射为包含物品数量（num_items）、推理文本及搭配角色（role）与查询的序列结构。

特点

该数据集的核心特点在于其性别平衡设计，通过均衡纳入FashionRec（女性）和AMZ（男性）数据，提升了模型在跨性别场景下的泛化能力。此外，每条样本不仅包含最终检索结果，还提供了详尽的推理链，使得模型能够学习从用户需求到具体搭配决策的中间逻辑。数据集中的每个搭配均由多个角色（role）及其对应查询构成，结构化的输出格式便于指导后续的检索与组合任务。这种兼具推理透明度与结构化标签的设计，使其特别适用于训练具备可解释性的时尚推荐系统。

使用方法

使用时，该数据集主要用于训练映射器模型，典型的基线模型为基于Qwen2.5-4B-Instruct微调的flavianv/qwen4b-mapper-50-50-regen-sft。用户可直接利用HuggingFace Datasets库加载该数据集，并将输入-输出对转换为适用于语言模型微调的格式。训练目标为学习从用户自然语言需求（need）生成包含推理链与结构化搭配指令的序列。相关代码与配置可在配套的GitHub仓库（clijo/reco-rl，outfit_bundle分支）中找到，便于复现实验或进行进一步的模型优化。

背景与挑战

背景概述

fashionrec-amz-mapper-50-50-sft数据集由研究人员flavianv等人于近期构建，旨在推动时尚推荐系统中跨性别与跨域映射能力的演进。该数据集融合了FashionRec（女性时尚）与AMZ（男性服饰）两个来源，总计1万条样本，且严格保持性别平衡（各5千条），聚焦于从用户需求（need）到服装搭配（outfit）的推理与检索映射。其核心研究问题在于，如何通过单一大型语言模型（Qwen3-32B）同时生成推理过程与逐槽位检索查询，从而提升推荐系统的泛化性与可解释性。该数据集对领域的影响在于，它为多源异构时尚数据的统一建模提供了基准，并为后续的强化学习训练（如DeepShopper项目）奠定了数据基础。

当前挑战

数据集面临的第一重挑战是领域问题的复杂性：时尚推荐不仅需要理解用户显式的需求描述（如风格、场合），还需隐式推理出符合性别平衡与审美协调的完整搭配组合，这对模型的跨域泛化能力提出了极高要求。构建过程中，挑战体现在数据融合与标注的精密性上：如何从两个来源（FashionRec与AMZ）的原始数据中提取可对齐的推理模板，并确保单次模型调用生成的推理与检索查询具有一致的逻辑一致性，是技术实现中的核心难点。此外，性别平衡的刻意设计虽然增强了数据代表性，但也可能导致模型对特定性别特征的过度依赖，需要谨慎处理偏见问题。

常用场景

经典使用场景

fashionrec-amz-mapper-50-50-sft数据集在时尚推荐与检索领域扮演着至关重要的角色，其最经典的使用场景是作为‘需求到搭配方案’映射器（Mapper）的训练与微调数据。该数据集通过将用户明确的着装需求（need）转化为结构化的推荐输出——包含所需物品数量、推理过程以及由角色与查询组成的完整搭配方案（outfit），从而直接服务于文本生成驱动的时尚搭配生成任务。研究者常用此数据集训练模型学习如何从自由形式的用户需求中解析出多物品搭配策略，并生成可检索的槽位查询，进而实现端到端的智能搭配推荐系统。

衍生相关工作

该数据集衍生了多项具有影响力的经典工作，最直接的是基于其训练的Qwen3-32B映射器模型（flavianv/qwen4b-mapper-50-50-regen-sft），该模型成为时尚搭配检索领域的强基线。此外，该数据集作为DeepShopper项目的重要组成部分，催生了reco-rl代码库（outfit_bundle分支），其中包含强化学习与检索增强生成相结合的推荐管线。其前身数据集fashionrec-task1-retrieval-mapper-sft与apparel23-bundle-retrieval-mapper-sft也因本工作得到了更广泛的应用，共同推动了多物品搭配生成从规则驱动向数据驱动范式的转变。

数据集最近研究