zalando-datasets/fashion_mnist

Name: zalando-datasets/fashion_mnist
Creator: zalando-datasets
Published: 2024-08-08 06:10:25
License: 暂无描述

Hugging Face2024-08-08 更新2024-06-15 收录

下载链接：

https://hf-mirror.com/datasets/zalando-datasets/fashion_mnist

下载链接

链接失效反馈

官方服务：

资源简介：

FashionMNIST是一个包含Zalando商品图像的数据集，由60,000个训练样本和10,000个测试样本组成。每个样本是一个28x28的灰度图像，并带有10个类别的标签。该数据集旨在作为原始MNIST数据集的直接替代品，用于机器学习算法的基准测试。它共享相同的图像大小和训练/测试分割结构。

FashionMNIST is a dataset containing Zalando product images, which consists of 60,000 training samples and 10,000 test samples. Each sample is a 28x28 grayscale image paired with a label from 10 predefined categories. This dataset is intended as a drop-in replacement for the original MNIST dataset for benchmarking machine learning algorithms, and it shares the same image size and training/test split structure as the original MNIST.

提供机构：

zalando-datasets

原始信息汇总

数据集概述

数据集描述

数据集摘要

Fashion-MNIST 是一个包含 Zalando 商品图像的数据集，由 60,000 个训练样本和 10,000 个测试样本组成。每个样本是一个 28x28 灰度图像，关联一个从 10 个类别中选择的标签。该数据集旨在作为机器学习算法的基准测试，直接替代原始的 MNIST 数据集。

支持的任务和排行榜

image-classification：目标是将有标签的 Zalando 商品图像分类到 10 个类别中的一个。

语言

数据集语言：英语

数据集结构

数据实例

每个数据点包含一个图像及其标签。

数据字段

image：一个 PIL.Image.Image 对象，包含 28x28 图像。
label：一个介于 0 和 9 之间的整数，表示以下类别：
- 0: T-shirt/top
- 1: Trouser
- 2: Pullover
- 3: Dress
- 4: Coat
- 5: Sandal
- 6: Shirt
- 7: Sneaker
- 8: Bag
- 9: Ankle boot

数据分割

数据分为训练集和测试集。训练集包含 60,000 张图像，测试集包含 10,000 张图像。

数据集创建

策划理由

Fashion-MNIST 旨在解决原始 MNIST 数据集的以下问题：

MNIST 过于简单。
MNIST 被过度使用。
MNIST 不能代表现代计算机视觉任务。

源数据

Fashion-MNIST 基于 Zalando 网站上的商品图像。原始图像为 762 × 1000 JPEG 格式，背景为浅灰色。图像经过一系列处理步骤，包括转换为 PNG 格式、裁剪、调整大小、锐化、扩展、反相和转换为 8 位灰度像素。

标注

类别标签使用商品的轮廓代码，由 Zalando 的内部时尚专家手动标注并由另一团队审核。

使用数据的注意事项

数据集的社会影响

[更多信息需要]

偏见的讨论

[更多信息需要]

其他已知限制

[更多信息需要]

附加信息

数据集策展人

Han Xiao, Kashif Rasul, Roland Vollgraf

许可信息

MIT 许可证

引用信息

@article{DBLP:journals/corr/abs-1708-07747, author = {Han Xiao and Kashif Rasul and Roland Vollgraf}, title = {Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms}, journal = {CoRR}, volume = {abs/1708.07747}, year = {2017}, url = {http://arxiv.org/abs/1708.07747}, archivePrefix = {arXiv}, eprint = {1708.07747}, timestamp = {Mon, 13 Aug 2018 16:47:27 +0200}, biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-07747}, bibsource = {dblp computer science bibliography, https://dblp.org} }

贡献

感谢 @gchhablani 添加此数据集。

搜集汇总

数据集介绍

构建方式

FashionMNIST数据集的构建基于Zalando网站上的商品图像，通过专业的摄影团队拍摄并经过一系列图像处理步骤生成。首先，从Zalando的商品库中选取70,000个独特商品的前视图缩略图，这些商品涵盖了不同性别群体。随后，这些缩略图经过多步骤的图像处理，包括转换为PNG格式、边缘修剪、尺寸调整、像素锐化、灰度转换等，最终生成28x28像素的灰度图像。标签则由Zalando的内部时尚专家手动标注，并经过独立团队的审核，确保每个商品仅对应一个类别标签。

特点

FashionMNIST数据集的主要特点在于其图像的高质量和专业性，以及标签的准确性。每个图像均为28x28像素的灰度图像，共包含10个类别，涵盖了从服装到鞋类的多种时尚商品。数据集的设计旨在作为原始MNIST数据集的直接替代品，用于机器学习算法的基准测试，特别是在图像分类任务中。其结构化的训练和测试集划分，以及明确的类别标签，使其成为评估和比较不同算法性能的理想选择。

使用方法

FashionMNIST数据集适用于图像分类任务，特别是多类别图像分类。用户可以通过加载数据集的训练和测试分割来训练和评估模型。数据集的图像和标签分别存储在'image'和'label'字段中，其中'image'字段包含28x28像素的灰度图像，'label'字段包含从0到9的整数，对应10个不同的时尚商品类别。建议用户在访问图像数据时，优先使用索引访问方式，以提高处理效率。

背景与挑战

背景概述

FashionMNIST数据集由Zalando Research团队于2017年创建，旨在替代传统的MNIST数据集，以更真实地反映现代计算机视觉任务的复杂性。该数据集包含60,000个训练样本和10,000个测试样本，每个样本为28x28像素的灰度图像，涵盖10种不同的时尚物品类别。FashionMNIST的设计初衷是为了提供一个更具挑战性的基准，以评估机器学习算法的性能，特别是在图像分类任务中。通过引入更复杂的图像内容，该数据集推动了计算机视觉领域的研究进展，成为许多研究人员和开发者的首选基准数据集之一。

当前挑战

FashionMNIST数据集在构建过程中面临了多个挑战。首先，如何从Zalando的商品图像中提取出具有代表性的样本，同时确保这些样本能够有效替代MNIST数据集，是一个重要的技术难题。其次，图像的预处理和标准化过程需要精确控制，以确保数据集的质量和一致性。此外，该数据集在图像分类任务中引入了更高的复杂性，要求算法具备更强的特征提取和模式识别能力。这些挑战不仅推动了数据集本身的优化，也促进了相关算法和模型的创新与发展。

常用场景

经典使用场景

在计算机视觉领域，FashionMNIST数据集被广泛用于图像分类任务的基准测试。其经典使用场景包括但不限于：评估和比较不同机器学习算法在多类别图像分类任务中的性能。由于其图像尺寸和数据结构与原始MNIST数据集相似，研究人员常将其作为替代数据集，以验证算法在处理复杂图像时的有效性。

实际应用

在实际应用中，FashionMNIST数据集可用于训练和验证服装识别系统，这些系统广泛应用于电子商务平台、零售业和智能购物助手等领域。通过准确分类服装图像，这些系统能够提供个性化的购物建议、库存管理和用户交互体验优化，从而提升商业效率和用户满意度。

衍生相关工作

FashionMNIST数据集的发布激发了一系列相关研究工作，包括但不限于：改进的图像分类算法、深度学习模型的优化、以及多模态数据融合技术。这些研究不仅提升了图像分类的准确性，还推动了计算机视觉技术在实际应用中的广泛采用。此外，该数据集还促进了跨领域的研究合作，如结合自然语言处理技术进行更复杂的服装推荐系统开发。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集