sandrocaseiro/fashionpedia
收藏Hugging Face2023-11-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sandrocaseiro/fashionpedia
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image_id
dtype: int64
- name: image
dtype: image
- name: width
dtype: int64
- name: height
dtype: int64
- name: objects
struct:
- name: bbox_id
sequence: int64
- name: bbox
sequence:
sequence: float64
- name: category
sequence:
class_label:
names:
'0': shirt, blouse
'1': top, t-shirt, sweatshirt
'2': sweater
'3': cardigan
'4': jacket
'5': vest
'6': pants
'7': shorts
'8': skirt
'9': coat
'10': dress
'11': jumpsuit
'12': cape
'13': glasses
'14': hat
'15': headband, head covering, hair accessory
'16': tie
'17': glove
'18': watch
'19': belt
'20': leg warmer
'21': tights, stockings
'22': sock
'23': shoe
'24': bag, wallet
'25': scarf
'26': umbrella
'27': hood
'28': collar
'29': lapel
'30': epaulette
'31': sleeve
'32': pocket
'33': neckline
'34': buckle
'35': zipper
'36': applique
'37': bead
'38': bow
'39': flower
'40': fringe
'41': ribbon
'42': rivet
'43': ruffle
'44': sequin
'45': tassel
- name: area
sequence: int64
- name: segmentation
sequence:
sequence:
sequence: int64
splits:
- name: train
num_bytes: 3812764522.759
num_examples: 45623
- name: val
num_bytes: 100185461.28
num_examples: 1158
download_size: 3519915966
dataset_size: 3912949984.039
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: val
path: data/val-*
---
# Dataset Card for "fashionpedia"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 名称:image_id,数据类型:int64(64位整数)
- 名称:image,数据类型:图像(image)
- 名称:width,数据类型:int64(64位整数)
- 名称:height,数据类型:int64(64位整数)
- 名称:objects,数据类型:结构体,包含以下子字段:
- 名称:bbox_id,数据类型:int64序列
- 名称:bbox(边界框),数据类型:双精度浮点数序列的序列
- 名称:category,数据类型:类别标签序列,类别映射如下:
'0': 衬衫、女式衬衫
'1': 上衣、T恤、运动衫
'2': 针织毛衣
'3': 开襟羊毛衫
'4': 夹克外套
'5': 马甲背心
'6': 长裤
'7': 短裤
'8': 半身裙
'9': 长款外套
'10': 连衣裙
'11': 连体衣裤
'12': 斗篷
'13': 眼镜
'14': 帽子
'15': 发带、头部配饰及头饰
'16': 领带
'17': 手套
'18': 手表
'19': 腰带
'20': 腿套
'21': 紧身裤、长筒丝袜
'22': 短袜
'23': 鞋履
'24': 包袋、钱包
'25': 围巾
'26': 雨伞
'27': 兜帽
'28': 衣领
'29': 翻领
'30': 肩章
'31': 衣袖
'32': 口袋
'33': 领口
'34': 带扣
'35': 拉链
'36': 贴花饰片
'37': 串珠装饰
'38': 蝴蝶结饰
'39': 花朵装饰
'40': 流苏边
'41': 饰带
'42': 铆钉
'43': 褶边饰
'44': 亮片饰
'45': 穗饰
- 名称:area,数据类型:int64序列
- 名称:segmentation,数据类型:整数序列的序列的序列(三维整数数组)
数据集拆分:
- 拆分名称:train(训练集),占用字节数:3812764522.759,样本量:45623
- 拆分名称:val(验证集),占用字节数:100185461.28,样本量:1158
总下载大小:3519915966 字节
总数据集大小:3912949984.039 字节
配置项:
- 配置名称:default(默认配置),数据文件路径:
- 训练集:data/train-*
- 验证集:data/val-*
---
# 「Fashionpedia」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
sandrocaseiro
原始信息汇总
数据集概述
特征信息
- image_id: 数据类型为
int64 - image: 数据类型为
image - width: 数据类型为
int64 - height: 数据类型为
int64 - objects: 结构化数据,包含以下子特征:
- bbox_id: 序列类型为
int64 - bbox: 序列类型为
float64 - category: 序列类型为
class_label,包含以下类别名称:- 0: shirt, blouse
- 1: top, t-shirt, sweatshirt
- 2: sweater
- 3: cardigan
- 4: jacket
- 5: vest
- 6: pants
- 7: shorts
- 8: skirt
- 9: coat
- 10: dress
- 11: jumpsuit
- 12: cape
- 13: glasses
- 14: hat
- 15: headband, head covering, hair accessory
- 16: tie
- 17: glove
- 18: watch
- 19: belt
- 20: leg warmer
- 21: tights, stockings
- 22: sock
- 23: shoe
- 24: bag, wallet
- 25: scarf
- 26: umbrella
- 27: hood
- 28: collar
- 29: lapel
- 30: epaulette
- 31: sleeve
- 32: pocket
- 33: neckline
- 34: buckle
- 35: zipper
- 36: applique
- 37: bead
- 38: bow
- 39: flower
- 40: fringe
- 41: ribbon
- 42: rivet
- 43: ruffle
- 44: sequin
- 45: tassel
- area: 序列类型为
int64 - segmentation: 序列类型为
int64
- bbox_id: 序列类型为
数据分割
- train: 包含 45623 个样本,大小为 3812764522.759 字节
- val: 包含 1158 个样本,大小为 100185461.28 字节
数据集大小
- 下载大小: 3519915966 字节
- 数据集大小: 3912949984.039 字节
配置信息
- default: 包含以下数据文件路径:
- train:
data/train-* - val:
data/val-*
- train:
搜集汇总
数据集介绍

构建方式
Fashionpedia数据集的构建依托于对时尚图像的深度分析与标注。该数据集通过收集大量时尚相关的图像,并利用先进的图像处理技术,对每张图像中的服装及其细节进行精确标注。标注内容包括服装类别、边界框、分割区域等,确保了数据的多样性和准确性。数据集的构建过程严格遵循了数据标注的标准流程,确保了数据的可靠性和科学性。
特点
Fashionpedia数据集以其丰富的服装类别和详细的标注信息而著称。该数据集涵盖了从基础服装如衬衫、裤子到复杂配饰如帽子、鞋类等共计46个类别。每个类别下都包含了详细的边界框和分割信息,使得数据集在时尚图像识别和分割任务中表现出色。此外,数据集还提供了图像的分辨率信息,为研究提供了更多的维度。
使用方法
Fashionpedia数据集适用于多种计算机视觉任务,特别是服装识别和图像分割。研究人员可以通过加载数据集中的图像和标注信息,训练和测试深度学习模型。数据集的结构化设计使得数据加载和处理变得简便,支持直接用于模型训练。此外,数据集的分割信息可以用于更精细的图像分析,如服装部件的识别和定位。
背景与挑战
背景概述
Fashionpedia数据集是一个专注于时尚领域的视觉识别数据集,由Sandro Caseiro等研究人员于近年推出。该数据集旨在通过提供丰富的图像标注信息,推动时尚物品的细粒度分类与属性识别研究。其核心研究问题在于如何通过计算机视觉技术,精确识别和分类时尚物品及其细节属性,如衣物类型、装饰元素等。Fashionpedia的发布为时尚行业的智能化应用,如虚拟试衣、智能推荐等,提供了重要的数据支持,并在学术界和工业界引起了广泛关注。
当前挑战
Fashionpedia数据集在解决时尚物品细粒度分类问题时,面临的主要挑战包括:1) 时尚物品的多样性与复杂性,尤其是相似类别之间的细微差异,增加了分类难度;2) 数据集构建过程中,标注的准确性与一致性难以保证,尤其是对于复杂的装饰元素和细节属性。此外,数据集的规模与多样性仍需进一步扩展,以覆盖更多时尚场景和风格,从而提升模型的泛化能力。
常用场景
经典使用场景
Fashionpedia数据集广泛应用于时尚领域的图像识别和分类任务中。该数据集通过提供详细的服装类别和属性标注,支持研究人员和开发者训练和评估深度学习模型,特别是在服装检测、分割和属性识别方面。其丰富的标注信息使得模型能够更准确地理解和解析时尚图像中的复杂元素。
解决学术问题
Fashionpedia数据集解决了时尚图像分析中的多个关键学术问题,如细粒度服装分类、属性识别和图像分割。通过提供高质量的标注数据,该数据集帮助研究者克服了传统方法在复杂场景下的局限性,推动了计算机视觉技术在时尚领域的应用和发展。其标注的多样性和精确性为模型训练提供了坚实的基础,显著提升了模型的性能。
衍生相关工作
Fashionpedia数据集衍生了许多经典的研究工作,特别是在服装检测和分割领域。基于该数据集的研究成果包括先进的深度学习模型和算法,这些成果不仅提升了时尚图像分析的准确性,还为其他相关领域的研究提供了宝贵的参考。例如,一些研究利用该数据集开发了高效的服装属性识别系统,进一步推动了时尚科技的发展。
以上内容由遇见数据集搜集并总结生成



