detection-datasets/fashionpedia_4_categories

Name: detection-datasets/fashionpedia_4_categories
Creator: detection-datasets
Published: 2022-09-22 14:45:18
License: 暂无描述

Hugging Face2022-09-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/detection-datasets/fashionpedia_4_categories

下载链接

链接失效反馈

官方服务：

资源简介：

Fashionpedia_4_categories数据集是Fashionpedia数据集的一个变体，主要区别在于它只包含4个类别（服装、鞋子、包和配饰），并且创建了新的数据集划分（训练集90%，验证集5%，测试集5%）。该数据集的目的是通过减少类别数量（从46个减少到4个）来简化目标检测任务。数据集使用了`detection_datasets`库进行创建，并通过映射将原始类别合并为4个主要类别，没有对应类别的注释被删除。

提供机构：

detection-datasets

原始信息汇总

数据集概述：Fashionpedia_4_categories

基本信息

名称：Fashionpedia_4_categories
任务类别：object-detection
语言：英语（en）
许可证：CC-BY-4.0
多语言性：单语种
大小类别：10K<n<100K
来源数据集：fashionpedia
标签：object-detection, fashion, computer-vision
paperswithcode_id：fashionpedia

数据集内容

类别数量：4
- Clothing
- Shoes
- Bags
- Accessories
数据划分：
- 训练集：90%的图像
- 验证集：5%
- 测试集：5%

数据处理

映射规则： Python mapping = { shirt, blouse: clothing, top, t-shirt, sweatshirt: clothing, sweater: clothing, cardigan: clothing, jacket: clothing, vest: clothing, pants: clothing, shorts: clothing, skirt: clothing, coat: clothing, dress: clothing, jumpsuit: clothing, cape: clothing, glasses: accessories, hat: accessories, headband, head covering, hair accessory: accessories, tie: accessories, glove: accessories, belt: accessories, tights, stockings: accessories, sock: accessories, shoe: shoes, bag, wallet: bags, scarf: accessories, }
结果：无映射对应的类别被移除。

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，目标检测任务常因类别繁多而面临挑战。Fashionpedia_4_categories数据集源自原始的Fashionpedia数据集，通过精心设计的类别映射策略，将原有的46个细粒度时尚品类聚合为四个核心类别：服装、鞋类、箱包和配饰。该映射过程借助detection_datasets库实现，具体而言，将衬衫、外套、裙子等归入服装，眼镜、帽子、围巾等归入配饰，鞋类与箱包则各自独立成类。原始标注中无对应映射的类别被剔除，从而生成一个精简而聚焦的数据集。此外，为便于模型训练与评估，数据集被重新划分为训练集（90%）、验证集（5%）和测试集（5%），确保数据划分的均衡性与代表性。

特点

该数据集的核心特点在于其类别精简性与任务聚焦性。相较于原始Fashionpedia的46个细粒度类别，本数据集仅保留四个高层级类别，显著降低了目标检测任务的复杂度，使其更适合于快速原型验证、教学演示或作为多类别模型的基准。类别映射逻辑紧密贴合时尚领域的实际认知，将语义相近的服饰单品合理聚合，既保留了关键语义信息，又避免了类别冗余。数据集规模维持在10K至100K之间，兼顾了数据多样性与计算效率。同时，标准化的训练-验证-测试划分方案为模型性能的横向比较提供了可靠基础。

使用方法

使用者可通过HuggingFace Datasets库直接加载该数据集，其接口与标准目标检测数据集兼容。加载后，数据以图像与边界框标注的形式呈现，其中边界框关联至四个类别标签之一。在模型训练中，可直接使用预定义的训练集与验证集进行参数优化与超参数调优，测试集则用于最终性能评估。若需进一步定制，可借助detection_datasets库对类别映射或数据划分进行二次调整。建议搭配基于CNN或Transformer的检测框架（如Faster R-CNN、YOLO、DETR）使用，并依据四个类别的样本分布调整损失函数权重，以优化检测精度。

背景与挑战

背景概述

Fashionpedia_4_categories数据集是源自Fashionpedia的一个精简变体，由detection-datasets团队于近年创建，旨在降低细粒度时尚物品检测的复杂性。原始Fashionpedia数据集包含46个精细类别，覆盖服装、配饰等时尚元素，其研究核心在于推动计算机视觉在时尚领域的应用，解决从图像中精准定位和识别多样化单品的问题。然而，46类别的细粒度标注对模型训练和评估带来了显著挑战。为此，Fashionpedia_4_categories通过将原始类别映射至衣物、鞋履、包袋及配饰四大宏观类别，并重新划分训练集（90%）、验证集（5%）和测试集（5%），聚焦于简化检测任务。这一数据集为初学者或资源受限场景提供了更易入手的基准，同时保留了时尚领域的关键特征，对目标检测算法的泛化能力研究具有重要参考价值。

当前挑战

Fashionpedia_4_categories所解决的领域挑战在于，原始Fashionpedia的46类别标注过于细粒度，导致模型在区分相似单品（如不同款式的衬衫与上衣）时易出错，且训练数据分布不均，影响检测精度。通过聚合为四类，该数据集降低了类别间语义重叠带来的混淆，提升了基础检测任务的可行性。在构建过程中，挑战主要源于类别映射的合理性：需确保原始46类别中的每一子类（如‘shirt, blouse’与‘top, t-shirt, sweatshirt’）均能准确归入‘Clothing’等宏观类别，避免歧义或遗漏。此外，部分无对应映射的注释（如‘sunglasses’）被丢弃，可能引入标签稀疏性问题，且新数据划分需平衡各类别样本数量，以维持训练集、验证集与测试集的代表性，确保评估的公平性。

常用场景

经典使用场景

在计算机视觉与时尚领域的交叉研究中，Fashionpedia_4_categories数据集以其精炼的类别体系脱颖而出。该数据集将原始Fashionpedia中46个细粒度服装属性简化为服装、鞋类、箱包和配饰四大基础类别，为物体检测任务提供了更易入门的基准。研究者常将其作为多类别检测模型的验证平台，尤其适用于评估轻量级网络在有限类别上的检测精度与效率。通过标准化的90%-5%-5%训练-验证-测试划分，该数据集为对比不同检测算法在时尚物品识别上的泛化能力提供了统一框架，避免了原始数据集中长尾分布带来的挑战。

衍生相关工作

基于Fashionpedia_4_categories的简化设计，衍生出多项具有启发性的研究工作。例如，部分学者利用该数据集验证了跨数据集迁移学习的有效性，将在此训练的检测器微调至更细粒度的时尚数据集。另有一些工作将其作为基准，对比不同数据增强策略（如CutMix、Mosaic）在少类别检测任务中的表现。此外，该数据集还催生了针对时尚领域的小样本检测研究，通过仅使用4个类别模拟实际业务中新品类的快速迭代场景，推动了模型在动态类目环境下的适应性改进。

数据集最近研究