Fashion-MNIST

github2019-09-22 更新2024-05-31 收录

下载链接：

https://github.com/TejasTidke/Classification-of-Fashion-Clothing-Dataset-Using-MLP

下载链接

链接失效反馈

官方服务：

资源简介：

Fashion-MNIST是一个包含Zalando商品图片的数据集，包含60,000个训练样本和10,000个测试样本。每个样本是一个28x28的灰度图像，与10个类别中的一个标签相关联。Zalando旨在用Fashion-MNIST作为原始MNIST数据集的直接替代品，用于基准测试机器学习算法。它与MNIST具有相同图像大小和训练测试分割结构。

Fashion-MNIST is a dataset comprising images of Zalando articles, including 60,000 training samples and 10,000 test samples. Each sample is a 28x28 grayscale image, associated with a label from one of ten categories. Zalando intends Fashion-MNIST to serve as a direct replacement for the original MNIST dataset for benchmarking machine learning algorithms. It shares the same image size and training-test split structure as MNIST.

创建时间：

2019-01-25

原始信息汇总

数据集概述

数据集名称

Fashion-MNIST

数据集内容

图像特征：每个图像为28x28像素的灰度图像。
像素值：每个像素的值表示该像素的亮度或黑暗度，值范围为0到255。
数据结构：训练集和测试集各有785列，其中第一列为类别标签，其余784列为像素值。

数据集大小

训练集：60,000个样本
测试集：10,000个样本

类别标签

0 - T-shirt/top
1 - Trouser
2 - Pullover
3 - Dress
4 - Coat
5 - Sandal
6 - Shirt
7 - Sneaker
8 - Bag
9 - Ankle boot

数据集用途

作为机器学习算法的基准测试数据集，特别是作为原始MNIST数据集的替代品。

数据集来源

原始数据集下载自：https://github.com/zalandoresearch/fashion-mnist
转换为CSV格式的脚本：https://pjreddie.com/projects/mnist-in-csv/

搜集汇总

数据集介绍

构建方式

Fashion-MNIST数据集由Zalando的服装图片构成，旨在作为传统MNIST数据集的直接替代品，用于机器学习算法的基准测试。该数据集包含60,000个训练样本和10,000个测试样本，每个样本均为28x28像素的灰度图像，并对应10个类别的标签。数据集的构建遵循了MNIST的结构，确保了图像大小及训练与测试分割的一致性。

特点

本数据集的特点在于其图像的普遍性及多样性，涵盖了T恤、裤子、套头衫等常见的服装类别。每个图像由784个像素值组成，这些值代表了像素的亮度，范围为0至255的整数。此外，数据集的标签体系明确，易于研究人员进行分类任务的研究与验证。

使用方法

使用Fashion-MNIST数据集前，需安装numpy、pandas和matplotlib库。数据集以CSV格式提供，可通过相应的脚本进行转换。用户可以直接加载训练集和测试集，根据像素值和标签进行机器学习模型的训练与评估。

背景与挑战

背景概述

Fashion-MNIST数据集脱胎于时尚电商Zalando的衣物图像，旨在作为传统MNIST数据集的直接替代品，以供机器学习算法的基准测试。该数据集由60,000个训练样本和10,000个测试样本组成，每个样本均为28x28像素的灰度图像，并对应10个类别的标签。自推出以来，Fashion-MNIST凭借其与MNIST数据集相似的图像尺寸和训练测试划分结构，在AI/ML/Data Science社群中受到广泛喜爱，并成为算法验证的重要基准。其创建不仅源于对MNIST的继承，也体现了对新型数据集需求的探索，对图像识别领域的发展产生了显著影响。

当前挑战

尽管Fashion-MNIST在图像识别领域内被广泛使用，但该数据集仍面临若干挑战。首先，它所解决的领域问题是时尚商品的分类，这一挑战在于如何准确区分不同类别的衣物图像。其次，在构建过程中，数据集的多样性和代表性亦是一大挑战，需确保数据能够涵盖各种风格、颜色和角度的衣物。此外，数据集的质量控制和预处理，如像素值的标准化和图像增强，也是确保算法泛化能力的关键环节。

常用场景

经典使用场景

在机器学习与数据科学领域，Fashion-MNIST数据集作为MNIST数据集的直接替代品，其经典使用场景在于成为算法基准测试的标杆。由于其与MNIST相同的大小和训练测试分割结构，研究者们常通过该数据集对算法进行初步验证，以确保算法在小规模图像分类任务上的有效性。

衍生相关工作

基于Fashion-MNIST数据集，学术界衍生出了一系列相关工作，包括改进的图像分类算法、对抗性样本的研究、以及数据增强技术等。这些研究进一步拓展了数据集的应用范围，并推动了计算机视觉领域的发展。

数据集最近研究