five

zalando-datasets/fashion_mnist

收藏
Hugging Face2024-08-08 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/zalando-datasets/fashion_mnist
下载链接
链接失效反馈
官方服务:
资源简介:
FashionMNIST是一个包含Zalando商品图像的数据集,由60,000个训练样本和10,000个测试样本组成。每个样本是一个28x28的灰度图像,并带有10个类别的标签。该数据集旨在作为原始MNIST数据集的直接替代品,用于机器学习算法的基准测试。它共享相同的图像大小和训练/测试分割结构。

FashionMNIST is a dataset containing Zalando product images, which consists of 60,000 training samples and 10,000 test samples. Each sample is a 28x28 grayscale image paired with a label from 10 predefined categories. This dataset is intended as a drop-in replacement for the original MNIST dataset for benchmarking machine learning algorithms, and it shares the same image size and training/test split structure as the original MNIST.
提供机构:
zalando-datasets
原始信息汇总

数据集概述

数据集描述

数据集摘要

Fashion-MNIST 是一个包含 Zalando 商品图像的数据集,由 60,000 个训练样本和 10,000 个测试样本组成。每个样本是一个 28x28 灰度图像,关联一个从 10 个类别中选择的标签。该数据集旨在作为机器学习算法的基准测试,直接替代原始的 MNIST 数据集。

支持的任务和排行榜

  • image-classification:目标是将有标签的 Zalando 商品图像分类到 10 个类别中的一个。

语言

  • 数据集语言:英语

数据集结构

数据实例

每个数据点包含一个图像及其标签。

数据字段

  • image:一个 PIL.Image.Image 对象,包含 28x28 图像。
  • label:一个介于 0 和 9 之间的整数,表示以下类别:
    • 0: T-shirt/top
    • 1: Trouser
    • 2: Pullover
    • 3: Dress
    • 4: Coat
    • 5: Sandal
    • 6: Shirt
    • 7: Sneaker
    • 8: Bag
    • 9: Ankle boot

数据分割

数据分为训练集和测试集。训练集包含 60,000 张图像,测试集包含 10,000 张图像。

数据集创建

策划理由

Fashion-MNIST 旨在解决原始 MNIST 数据集的以下问题:

  • MNIST 过于简单。
  • MNIST 被过度使用。
  • MNIST 不能代表现代计算机视觉任务。

源数据

Fashion-MNIST 基于 Zalando 网站上的商品图像。原始图像为 762 × 1000 JPEG 格式,背景为浅灰色。图像经过一系列处理步骤,包括转换为 PNG 格式、裁剪、调整大小、锐化、扩展、反相和转换为 8 位灰度像素。

标注

类别标签使用商品的轮廓代码,由 Zalando 的内部时尚专家手动标注并由另一团队审核。

使用数据的注意事项

数据集的社会影响

[更多信息需要]

偏见的讨论

[更多信息需要]

其他已知限制

[更多信息需要]

附加信息

数据集策展人

Han Xiao, Kashif Rasul, Roland Vollgraf

许可信息

MIT 许可证

引用信息

@article{DBLP:journals/corr/abs-1708-07747, author = {Han Xiao and Kashif Rasul and Roland Vollgraf}, title = {Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms}, journal = {CoRR}, volume = {abs/1708.07747}, year = {2017}, url = {http://arxiv.org/abs/1708.07747}, archivePrefix = {arXiv}, eprint = {1708.07747}, timestamp = {Mon, 13 Aug 2018 16:47:27 +0200}, biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-07747}, bibsource = {dblp computer science bibliography, https://dblp.org} }

贡献

感谢 @gchhablani 添加此数据集。

搜集汇总
数据集介绍
main_image_url
构建方式
FashionMNIST数据集的构建基于Zalando网站上的商品图像,通过专业的摄影团队拍摄并经过一系列图像处理步骤生成。首先,从Zalando的商品库中选取70,000个独特商品的前视图缩略图,这些商品涵盖了不同性别群体。随后,这些缩略图经过多步骤的图像处理,包括转换为PNG格式、边缘修剪、尺寸调整、像素锐化、灰度转换等,最终生成28x28像素的灰度图像。标签则由Zalando的内部时尚专家手动标注,并经过独立团队的审核,确保每个商品仅对应一个类别标签。
特点
FashionMNIST数据集的主要特点在于其图像的高质量和专业性,以及标签的准确性。每个图像均为28x28像素的灰度图像,共包含10个类别,涵盖了从服装到鞋类的多种时尚商品。数据集的设计旨在作为原始MNIST数据集的直接替代品,用于机器学习算法的基准测试,特别是在图像分类任务中。其结构化的训练和测试集划分,以及明确的类别标签,使其成为评估和比较不同算法性能的理想选择。
使用方法
FashionMNIST数据集适用于图像分类任务,特别是多类别图像分类。用户可以通过加载数据集的训练和测试分割来训练和评估模型。数据集的图像和标签分别存储在'image'和'label'字段中,其中'image'字段包含28x28像素的灰度图像,'label'字段包含从0到9的整数,对应10个不同的时尚商品类别。建议用户在访问图像数据时,优先使用索引访问方式,以提高处理效率。
背景与挑战
背景概述
FashionMNIST数据集由Zalando Research团队于2017年创建,旨在替代传统的MNIST数据集,以更真实地反映现代计算机视觉任务的复杂性。该数据集包含60,000个训练样本和10,000个测试样本,每个样本为28x28像素的灰度图像,涵盖10种不同的时尚物品类别。FashionMNIST的设计初衷是为了提供一个更具挑战性的基准,以评估机器学习算法的性能,特别是在图像分类任务中。通过引入更复杂的图像内容,该数据集推动了计算机视觉领域的研究进展,成为许多研究人员和开发者的首选基准数据集之一。
当前挑战
FashionMNIST数据集在构建过程中面临了多个挑战。首先,如何从Zalando的商品图像中提取出具有代表性的样本,同时确保这些样本能够有效替代MNIST数据集,是一个重要的技术难题。其次,图像的预处理和标准化过程需要精确控制,以确保数据集的质量和一致性。此外,该数据集在图像分类任务中引入了更高的复杂性,要求算法具备更强的特征提取和模式识别能力。这些挑战不仅推动了数据集本身的优化,也促进了相关算法和模型的创新与发展。
常用场景
经典使用场景
在计算机视觉领域,FashionMNIST数据集被广泛用于图像分类任务的基准测试。其经典使用场景包括但不限于:评估和比较不同机器学习算法在多类别图像分类任务中的性能。由于其图像尺寸和数据结构与原始MNIST数据集相似,研究人员常将其作为替代数据集,以验证算法在处理复杂图像时的有效性。
实际应用
在实际应用中,FashionMNIST数据集可用于训练和验证服装识别系统,这些系统广泛应用于电子商务平台、零售业和智能购物助手等领域。通过准确分类服装图像,这些系统能够提供个性化的购物建议、库存管理和用户交互体验优化,从而提升商业效率和用户满意度。
衍生相关工作
FashionMNIST数据集的发布激发了一系列相关研究工作,包括但不限于:改进的图像分类算法、深度学习模型的优化、以及多模态数据融合技术。这些研究不仅提升了图像分类的准确性,还推动了计算机视觉技术在实际应用中的广泛采用。此外,该数据集还促进了跨领域的研究合作,如结合自然语言处理技术进行更复杂的服装推荐系统开发。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作