fashion

Hugging Face2025-08-24 更新2025-08-25 收录

下载链接：

https://huggingface.co/datasets/fj11/fashion

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个多类语义分割数据集，它合并了DeepFashion2风格的标签和比基尼分割标签。数据集在DeepFashion2的46个类别之上增加了一个额外的类别“比基尼”。该数据集适合用于如SegFormer、U-Net等模型。数据集包含RGB时尚照片和单通道PNG掩模，其中掩模的每个像素都有类ID。没有明确的背景类别，未注释的像素标记为“未标记”。

This is a multi-class semantic segmentation dataset that merges DeepFashion2-style annotations with bikini segmentation labels. It adds an extra category "bikini" based on the 46 categories of DeepFashion2. This dataset is suitable for models such as SegFormer, U-Net and other similar architectures. The dataset contains RGB fashion photographs and single-channel PNG masks, where each pixel in the mask corresponds to a class ID. There is no explicit background category, and unannotated pixels are marked as "unlabeled".

创建时间：

2025-08-23

原始信息汇总

Fashion Segmentation (Combined: DeepFashion2 + Bikini) 数据集概述

数据集简介

一个多类别语义分割数据集，合并了DeepFashion2风格的标签和比基尼分割标注。适用于SegFormer、U-Net等模型。

数据内容

图像类型: RGB时尚照片
掩码格式: 单通道PNG图像，包含逐像素类别ID
类别映射: 包含ID 0-47，其中：
- 0 = 未标注（无标注的像素）
- 1-46 = DeepFashion2风格的服装和配饰
- 47 = 比基尼（来自Roboflow源）

数据集规模

总下载大小: 24,646,426,043字节
总数据集大小: 25,660,070,697.604字节

数据划分

训练集: 43,719个样本，24,391,870,107.012字节
验证集: 2,302个样本，1,268,200,590.592字节
测试集: 可选划分

采用多标签分层划分方法，保持各类别在各划分中的比例相似。

数据结构

每个样本包含：

image: PIL RGB图像 (H, W, 3)
label: PIL "L"图像 (H, W)，值为{0..47}

来源说明

该数据集合并和重新打包了以下来源的标注和/或图像：

Hugging Face数据集: sayeed99/fashion_segmentation
Roboflow项目: bikini-detector-v24

引用方式

text @misc{fashion-segmentation-combined, title = {Fashion Segmentation (Combined DeepFashion2 + Bikini)}, author = {Jian}, year = {2025}, howpublished = {url{https://huggingface.co/datasets/fj11/fashion}} }

搜集汇总

数据集介绍

构建方式

在时尚图像语义分割领域，该数据集通过融合两个权威数据源构建而成。其整合了DeepFashion2数据集的46类服饰标注体系，并额外引入Roboflow平台提供的比基尼检测数据，新增第47类专属标签。采用多标签分层抽样策略进行数据划分，确保训练集、验证集和测试集之间的类别分布保持高度一致性，有效避免了模型训练过程中的偏差问题。

特点

该数据集最显著的特征在于其扩展的类别体系与精细的标注质量。除了包含上衣、连衣裙、配饰等46类常规服饰标注外，特别增加了比基尼专用类别，形成0-47的完整标签体系。所有掩码均采用单通道PNG格式存储，像素级标注精度保障了分割任务的可靠性。数据集未设置显式背景类别，未标注区域统一标记为0值，这种设计既保留了原始数据的完整性，又为模型训练提供了清晰的语义边界。

使用方法

使用者可通过Hugging Face Datasets库直接加载该数据集，调用load_dataset函数即可获取结构化数据。每个样本包含RGB图像和对应的分割掩码，掩码采用PIL图像格式存储类别ID。为便于可视化分析，建议使用matplotlib库对比显示原始图像与分割效果，并通过numpy数组操作提取掩码中的唯一类别标识。数据加载后可直接输入SegFormer、U-Net等主流分割网络进行训练，其标准化格式确保了与现有深度学习框架的完美兼容性。

背景与挑战

背景概述

时尚语义分割数据集fashion由研究人员Jian于2025年构建，整合了DeepFashion2和Roboflow平台的标注数据。该数据集专注于服装图像的精细语义分割，涵盖47个类别包括上衣、泳装及配饰等，旨在推动计算机视觉在时尚领域的应用。通过多标签分层分割策略，该数据集为时尚图像分析提供了高质量标注基准，对智能穿搭推荐系统和虚拟试衣技术发展具有重要价值。

当前挑战

该数据集核心挑战在于解决时尚物品的复杂形态分割问题，包括衣物褶皱变形、材质纹理差异以及多类别重叠区域的精确划分。构建过程中面临标注一致性难题，需协调DeepFashion2原有46类标签与新增泳装类别的语义兼容性。多源数据整合时存在标注标准差异，需通过像素级ID映射实现语义统一，同时保持各类别在训练验证集中的分布平衡。

常用场景

经典使用场景

在时尚计算领域，该数据集为语义分割任务提供了高质量的像素级标注资源。研究者通常利用其精细的服饰类别划分，训练深度神经网络如SegFormer和U-Net等模型，实现对服装图像的精确部件识别。通过将DeepFashion2的46类标签与比基尼专用标注融合，该数据集显著提升了多类别时尚物品分割的学术研究价值，成为时尚图像理解领域的重要基准。

衍生相关工作

该数据集衍生了一系列经典研究工作，包括基于多尺度特征的时尚物品分割算法和改进的注意力机制模型。研究者利用其丰富的标注信息开发了融合全局上下文与局部细节的分割网络，在时尚图像解析任务中取得了突破性进展。这些工作不仅推动了语义分割技术的发展，还为跨域时尚分析提供了新的方法论框架，促进了计算机视觉与时尚计算的交叉融合。

数据集最近研究