five

glami/glami-1m

收藏
Hugging Face2023-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/glami/glami-1m
下载链接
链接失效反馈
官方服务:
资源简介:
GLAMI-1M数据集包含110万件时尚单品,96.8万张独特图片和100万条独特文本。数据集涵盖13种欧洲语言和191个细粒度类别,例如有15种鞋类。数据集包含专业策展人提供的高质量注释,并展示了一个复杂的生产行业问题。每个样本包括图片、国家代码、对应语言的名称、描述、目标类别和标签来源,标签来源可以是人工或基于规则的,但大多数样本的标签是人工标注的。

The GLAMI-1M Dataset comprises 1.1 million fashion items, 968,000 unique images, and 1 million unique text entries. It covers 13 European languages and encompasses 191 fine-grained product categories, with footwear alone containing 15 distinct sub-categories as an example. The dataset provides high-quality annotations curated by professional curators, and exemplifies a complex challenge within the fashion production industry. Each sample consists of an image, country code, language-matched product name, description, target category, and label source. The label source can be either human-generated or rule-based, while the majority of samples have manually annotated labels.
提供机构:
glami
原始信息汇总

GLAMI-1M数据集概述

数据集内容

  • 规模: 包含1.1百万时尚商品,其中96.8万张独特图片和1百万独特文本。
  • 语言: 涵盖13种语言,主要为欧洲语言。
  • 类别: 包含191个细粒度类别,例如有15种不同类型的鞋子。
  • 样本组成: 每个样本包括一张图片、国家代码、相应语言的名称、描述、目标类别及标签来源。标签来源主要为人工标注。

数据集特点

  • 高质量标注: 由专业策展人提供的高质量标注。
  • 行业问题: 呈现了一个具有挑战性的生产行业问题。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作