glami/glami-1m
收藏Hugging Face2023-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/glami/glami-1m
下载链接
链接失效反馈官方服务:
资源简介:
GLAMI-1M数据集包含110万件时尚单品,96.8万张独特图片和100万条独特文本。数据集涵盖13种欧洲语言和191个细粒度类别,例如有15种鞋类。数据集包含专业策展人提供的高质量注释,并展示了一个复杂的生产行业问题。每个样本包括图片、国家代码、对应语言的名称、描述、目标类别和标签来源,标签来源可以是人工或基于规则的,但大多数样本的标签是人工标注的。
The GLAMI-1M Dataset comprises 1.1 million fashion items, 968,000 unique images, and 1 million unique text entries. It covers 13 European languages and encompasses 191 fine-grained product categories, with footwear alone containing 15 distinct sub-categories as an example. The dataset provides high-quality annotations curated by professional curators, and exemplifies a complex challenge within the fashion production industry. Each sample consists of an image, country code, language-matched product name, description, target category, and label source. The label source can be either human-generated or rule-based, while the majority of samples have manually annotated labels.
提供机构:
glami
原始信息汇总
GLAMI-1M数据集概述
数据集内容
- 规模: 包含1.1百万时尚商品,其中96.8万张独特图片和1百万独特文本。
- 语言: 涵盖13种语言,主要为欧洲语言。
- 类别: 包含191个细粒度类别,例如有15种不同类型的鞋子。
- 样本组成: 每个样本包括一张图片、国家代码、相应语言的名称、描述、目标类别及标签来源。标签来源主要为人工标注。
数据集特点
- 高质量标注: 由专业策展人提供的高质量标注。
- 行业问题: 呈现了一个具有挑战性的生产行业问题。



