zalando-datasets/fashion_mnist
收藏数据集概述
数据集描述
数据集摘要
Fashion-MNIST 是一个包含 Zalando 商品图像的数据集,由 60,000 个训练样本和 10,000 个测试样本组成。每个样本是一个 28x28 灰度图像,关联一个从 10 个类别中选择的标签。该数据集旨在作为机器学习算法的基准测试,直接替代原始的 MNIST 数据集。
支持的任务和排行榜
image-classification:目标是将有标签的 Zalando 商品图像分类到 10 个类别中的一个。
语言
- 数据集语言:英语
数据集结构
数据实例
每个数据点包含一个图像及其标签。
数据字段
image:一个PIL.Image.Image对象,包含 28x28 图像。label:一个介于 0 和 9 之间的整数,表示以下类别:- 0: T-shirt/top
- 1: Trouser
- 2: Pullover
- 3: Dress
- 4: Coat
- 5: Sandal
- 6: Shirt
- 7: Sneaker
- 8: Bag
- 9: Ankle boot
数据分割
数据分为训练集和测试集。训练集包含 60,000 张图像,测试集包含 10,000 张图像。
数据集创建
策划理由
Fashion-MNIST 旨在解决原始 MNIST 数据集的以下问题:
- MNIST 过于简单。
- MNIST 被过度使用。
- MNIST 不能代表现代计算机视觉任务。
源数据
Fashion-MNIST 基于 Zalando 网站上的商品图像。原始图像为 762 × 1000 JPEG 格式,背景为浅灰色。图像经过一系列处理步骤,包括转换为 PNG 格式、裁剪、调整大小、锐化、扩展、反相和转换为 8 位灰度像素。
标注
类别标签使用商品的轮廓代码,由 Zalando 的内部时尚专家手动标注并由另一团队审核。
使用数据的注意事项
数据集的社会影响
[更多信息需要]
偏见的讨论
[更多信息需要]
其他已知限制
[更多信息需要]
附加信息
数据集策展人
Han Xiao, Kashif Rasul, Roland Vollgraf
许可信息
MIT 许可证
引用信息
@article{DBLP:journals/corr/abs-1708-07747, author = {Han Xiao and Kashif Rasul and Roland Vollgraf}, title = {Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms}, journal = {CoRR}, volume = {abs/1708.07747}, year = {2017}, url = {http://arxiv.org/abs/1708.07747}, archivePrefix = {arXiv}, eprint = {1708.07747}, timestamp = {Mon, 13 Aug 2018 16:47:27 +0200}, biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-07747}, bibsource = {dblp computer science bibliography, https://dblp.org} }
贡献
感谢 @gchhablani 添加此数据集。




