five

fashion-pedia

收藏
Hugging Face2025-04-03 更新2025-04-07 收录
下载链接:
https://huggingface.co/datasets/tilak1114/fashion-pedia
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个图像数据集,包含了图片ID、图片内容、宽度、高度、原始URL、属性ID、对象掩码、对象边界框和对象类别ID等字段。数据集分为训练集和测试集两部分,可以用于图像识别、图像分割等任务。

This is an image dataset containing fields such as image ID, image content, width, height, original URL, attribute ID, object mask, object bounding box, and object category ID. The dataset is divided into two subsets: the training set and the test set, which can be used for tasks such as image recognition and image segmentation.
创建时间:
2025-04-03
搜集汇总
数据集介绍
main_image_url
构建方式
在时尚计算领域,FashionPedia数据集的构建体现了多模态数据融合的前沿理念。该数据集通过专业标注团队对45623张训练图像和1158张测试图像进行精细标注,每张图像均包含像素级物体分割掩码、边界框坐标以及多层级属性标签。原始数据采集自主流时尚平台,在保持图像分辨率多样性的同时,通过标准化流程处理了图像尺寸、URL元数据等关键信息,形成结构化的序列标注体系。
特点
作为时尚细粒度识别领域的标杆数据集,FashionPedia最显著的特点是融合了视觉与语义的双重标注维度。图像数据不仅包含常规的物体检测框,还精确到像素级别的服饰部件分割掩码。其分类体系采用层级化设计,通过object_category_ids和object_attribute_ids的双重编码,能同时捕捉服饰品类和材质、款式等属性特征。原始URL字段的保留则为时尚趋势研究提供了可追溯的数据链路。
使用方法
该数据集特别适合用于时尚领域的多任务学习研究。研究者可基于图像字段进行视觉特征提取,结合object_bboxes实现目标检测任务,或利用object_masks开展实例分割实验。attribute_ids序列支持细粒度属性分类,而多维标注的嵌套结构要求使用者注意序列对齐处理。官方提供的train-test划分方案建议采用交叉验证以应对测试集样本量较小的情况,原始URL信息可用于数据扩充时的溯源验证。
背景与挑战
背景概述
Fashion-Pedia数据集诞生于2020年,由谷歌研究院与加州理工学院联合推出,旨在推动时尚领域的细粒度视觉理解研究。该数据集聚焦于服装图像的实例分割与属性识别,涵盖超过45,000张高分辨率图像,每张图像均标注了精确的物体边界框、分割掩码及丰富的属性标签。其创新性在于首次将服装部件级别的语义分割与多层次属性识别相结合,为时尚推荐系统、虚拟试衣等应用提供了关键数据支撑。该数据集的发布显著提升了计算机视觉模型对服装材质、款式等细微特征的识别能力,成为时尚AI领域的重要基准。
当前挑战
Fashion-Pedia面临的核心挑战体现在两个方面:在领域问题层面,服装部件的非刚性变形与遮挡问题导致实例分割精度难以提升,而跨品牌款式差异使得属性识别面临语义鸿沟;在构建过程中,细粒度标注需要专业时尚知识支持,标注者需区分近千种属性组合,标注一致性维护成本极高。此外,服装图像的透明材质反光、复杂褶皱等视觉干扰因素,大幅增加了高质量标注的难度。这些挑战推动着多模态融合标注与半自动标注工具的创新研发。
常用场景
经典使用场景
在计算机视觉领域,Fashion-Pedia数据集以其丰富的时尚图像标注信息成为研究服装识别与属性分析的重要基准。该数据集广泛应用于时尚物品的多标签分类、实例分割以及细粒度属性识别任务,为算法在复杂场景下的物体检测与语义理解提供了标准化测试平台。其独特的层级化属性标注体系特别适合探索服饰品类间的语义关联性,推动了跨类别时尚元素联合分析的研究进展。
解决学术问题
该数据集有效解决了时尚计算领域三大核心问题:多层级服饰属性联合预测的建模难题、遮挡环境下服饰实例分割的精度问题,以及跨品牌服饰细粒度识别的泛化性挑战。通过提供27个主品类与294种属性的精细标注,建立了服装语义理解与视觉特征间的映射桥梁,显著提升了算法对时尚单品的材质、款式、功能等多维度属性的理解能力,为可解释性时尚分析模型的发展奠定了数据基础。
衍生相关工作
该数据集催生了多个标志性研究,包括融合知识图谱的时尚属性推理框架FashionBERT、基于注意力机制的层级属性预测模型HFN,以及跨模态的时尚检索系统FashionSearchNet。在CVPR2021举办的Fashion-IQ挑战赛中,超过30支团队使用该数据集进行多模态时尚匹配算法评估,相关成果已应用于Pinterest等平台的视觉搜索服务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作