five

fashion

收藏
Hugging Face2025-08-24 更新2025-08-25 收录
下载链接:
https://huggingface.co/datasets/fj11/fashion
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个多类语义分割数据集,它合并了DeepFashion2风格的标签和比基尼分割标签。数据集在DeepFashion2的46个类别之上增加了一个额外的类别“比基尼”。该数据集适合用于如SegFormer、U-Net等模型。数据集包含RGB时尚照片和单通道PNG掩模,其中掩模的每个像素都有类ID。没有明确的背景类别,未注释的像素标记为“未标记”。

This is a multi-class semantic segmentation dataset that merges DeepFashion2-style annotations with bikini segmentation labels. It adds an extra category "bikini" based on the 46 categories of DeepFashion2. This dataset is suitable for models such as SegFormer, U-Net and other similar architectures. The dataset contains RGB fashion photographs and single-channel PNG masks, where each pixel in the mask corresponds to a class ID. There is no explicit background category, and unannotated pixels are marked as "unlabeled".
创建时间:
2025-08-23
原始信息汇总

Fashion Segmentation (Combined: DeepFashion2 + Bikini) 数据集概述

数据集简介

一个多类别语义分割数据集,合并了DeepFashion2风格的标签和比基尼分割标注。适用于SegFormer、U-Net等模型。

数据内容

  • 图像类型: RGB时尚照片
  • 掩码格式: 单通道PNG图像,包含逐像素类别ID
  • 类别映射: 包含ID 0-47,其中:
    • 0 = 未标注(无标注的像素)
    • 1-46 = DeepFashion2风格的服装和配饰
    • 47 = 比基尼(来自Roboflow源)

数据集规模

  • 总下载大小: 24,646,426,043字节
  • 总数据集大小: 25,660,070,697.604字节

数据划分

  • 训练集: 43,719个样本,24,391,870,107.012字节
  • 验证集: 2,302个样本,1,268,200,590.592字节
  • 测试集: 可选划分

采用多标签分层划分方法,保持各类别在各划分中的比例相似。

数据结构

每个样本包含:

  • image: PIL RGB图像 (H, W, 3)
  • label: PIL "L"图像 (H, W),值为{0..47}

来源说明

该数据集合并和重新打包了以下来源的标注和/或图像:

  • Hugging Face数据集: sayeed99/fashion_segmentation
  • Roboflow项目: bikini-detector-v24

引用方式

text @misc{fashion-segmentation-combined, title = {Fashion Segmentation (Combined DeepFashion2 + Bikini)}, author = {Jian}, year = {2025}, howpublished = {url{https://huggingface.co/datasets/fj11/fashion}} }

搜集汇总
数据集介绍
main_image_url
构建方式
在时尚图像语义分割领域,该数据集通过融合两个权威数据源构建而成。其整合了DeepFashion2数据集的46类服饰标注体系,并额外引入Roboflow平台提供的比基尼检测数据,新增第47类专属标签。采用多标签分层抽样策略进行数据划分,确保训练集、验证集和测试集之间的类别分布保持高度一致性,有效避免了模型训练过程中的偏差问题。
特点
该数据集最显著的特征在于其扩展的类别体系与精细的标注质量。除了包含上衣、连衣裙、配饰等46类常规服饰标注外,特别增加了比基尼专用类别,形成0-47的完整标签体系。所有掩码均采用单通道PNG格式存储,像素级标注精度保障了分割任务的可靠性。数据集未设置显式背景类别,未标注区域统一标记为0值,这种设计既保留了原始数据的完整性,又为模型训练提供了清晰的语义边界。
使用方法
使用者可通过Hugging Face Datasets库直接加载该数据集,调用load_dataset函数即可获取结构化数据。每个样本包含RGB图像和对应的分割掩码,掩码采用PIL图像格式存储类别ID。为便于可视化分析,建议使用matplotlib库对比显示原始图像与分割效果,并通过numpy数组操作提取掩码中的唯一类别标识。数据加载后可直接输入SegFormer、U-Net等主流分割网络进行训练,其标准化格式确保了与现有深度学习框架的完美兼容性。
背景与挑战
背景概述
时尚语义分割数据集fashion由研究人员Jian于2025年构建,整合了DeepFashion2和Roboflow平台的标注数据。该数据集专注于服装图像的精细语义分割,涵盖47个类别包括上衣、泳装及配饰等,旨在推动计算机视觉在时尚领域的应用。通过多标签分层分割策略,该数据集为时尚图像分析提供了高质量标注基准,对智能穿搭推荐系统和虚拟试衣技术发展具有重要价值。
当前挑战
该数据集核心挑战在于解决时尚物品的复杂形态分割问题,包括衣物褶皱变形、材质纹理差异以及多类别重叠区域的精确划分。构建过程中面临标注一致性难题,需协调DeepFashion2原有46类标签与新增泳装类别的语义兼容性。多源数据整合时存在标注标准差异,需通过像素级ID映射实现语义统一,同时保持各类别在训练验证集中的分布平衡。
常用场景
经典使用场景
在时尚计算领域,该数据集为语义分割任务提供了高质量的像素级标注资源。研究者通常利用其精细的服饰类别划分,训练深度神经网络如SegFormer和U-Net等模型,实现对服装图像的精确部件识别。通过将DeepFashion2的46类标签与比基尼专用标注融合,该数据集显著提升了多类别时尚物品分割的学术研究价值,成为时尚图像理解领域的重要基准。
衍生相关工作
该数据集衍生了一系列经典研究工作,包括基于多尺度特征的时尚物品分割算法和改进的注意力机制模型。研究者利用其丰富的标注信息开发了融合全局上下文与局部细节的分割网络,在时尚图像解析任务中取得了突破性进展。这些工作不仅推动了语义分割技术的发展,还为跨域时尚分析提供了新的方法论框架,促进了计算机视觉与时尚计算的交叉融合。
数据集最近研究
最新研究方向
在时尚图像语义分割领域,该融合数据集正推动多类别细粒度分割技术的前沿探索。研究者们聚焦于跨域服装部件的精准识别,特别是针对泳装类别的特殊纹理和轮廓特征提取。当前热点集中于利用Transformer架构(如SegFormer)实现端到端的像素级分类,同时结合多尺度特征融合技术提升复杂服饰边缘的分割精度。该数据集通过引入Roboflow的泳装标注数据,有效扩展了DeepFashion2的类别体系,为虚拟试衣、时尚推荐等应用场景提供了更丰富的语义支持。其分层抽样策略保障了类别分布的均衡性,显著提升了模型在长尾类别上的泛化能力,对推动时尚计算机视觉的实际落地具有重要价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作