five

Fashion-MNIST

收藏
github2024-05-16 更新2024-05-31 收录
下载链接:
https://github.com/nuclearczy/SVM_and_CNN_on_Fashion_MNIST_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Fashion-MNIST是一个包含Zalando商品图片的数据集,由60,000个训练样本和10,000个测试样本组成。每个样本是一个28x28像素的灰度图像,并关联一个来自10个类别的标签。

Fashion-MNIST is a dataset comprising images of Zalando articles, consisting of 60,000 training samples and 10,000 test samples. Each sample is a 28x28 pixel grayscale image, associated with a label from one of 10 categories.
创建时间:
2019-11-12
原始信息汇总

数据集概述

数据集名称: Fashion-MNIST

数据集描述: Fashion-MNIST是一个包含Zalando商品图片的数据集,包含60,000个训练样本和10,000个测试样本。每个样本是一个28x28的灰度图像,关联一个从10个类别中选择的标签。

数据集可视化: Dataset Visualized

机器学习方法

支持向量机(SVM)

  • 方法: 使用PCA和LDA进行维度降低,然后应用SVM进行分类。
  • 参数:
    • PCA参数: pca_target_dim(目标维度)
    • LDA参数: components_number(组件数量)
    • SVM参数: kernel(核类型)
  • 结果:
    • 维度降低可视化: LDA and PCA Visualization
    • 不同核的SVM性能:
      数据集 SVM Poly SVM RBF
      LDA训练集 84.47% 85.19%
      PCA训练集 87.87% 88.35%
      LDA测试集 82.49% 83.41%
      PCA测试集 86.03% 86.59%
    • 时间成本:
      数据集 SVM Poly SVM RBF
      训练集 148.41s 172.30s
      测试集 73.51s 81.74s

卷积神经网络(CNN)

  • 模型: 应用了Resnet、VGGnet和Alexnet三种CNN模型。
  • 结果:
    • 不同CNN模型的性能:
      模型 准确率 轮次 训练时间
      Resnet18 84.19% 2 18.37 mins
      Resnet18 89.91% 10 91.41 mins
      Resnet50 78.24% 4 82.88 mins
      VGGnet16 89.71% 2 63.65 mins
      Alexnet 84.38% 2 22.60 mins
    • 自定义CNN模型的性能:
      轮次 Resnet18 自定义CNN (2Conv 3Hidden)
      1 82.51% 82.13%
      2 84.81% 85.40%
      3 86.33% 86.58%
      4 86.82% 87.92%
      5 86.54% 86.91%
      6 88.67% 88.10%
      7 89.66% 87.99%
      8 87.37% 88.38%
      9 89.73% 88.68%
      10 90.07% 89.00%
      11 89.87% 88.57%
      12 89.65% 88.90%
      13 89.83% 89.36%
      14 90.75% 89.54%
      15 90.11% 88.86%
      16 90.23% 89.48%
      17 90.46% 88.31%
      18 90.12% 89.35%
      19 90.35% 88.81%
      20 90.61% 89.66%
      总时间 110.11mins 19.77mins

结论

  • SVM: RBF核的SVM在准确率上表现更好,但训练时间较长。
  • CNN: 自定义CNN模型在训练时间上显著优于Resnet18,且在某些轮次中达到相似或更高的准确率。
搜集汇总
数据集介绍
main_image_url
构建方式
Fashion-MNIST数据集由Zalando公司构建,旨在提供一个替代传统MNIST数据集的图像分类基准。该数据集包含60,000个训练样本和10,000个测试样本,每个样本均为28x28像素的灰度图像,并附带一个从10个类别中提取的标签。通过精心设计的图像采集和标注流程,确保了数据集的高质量和多样性,为图像分类任务提供了丰富的训练和测试资源。
特点
Fashion-MNIST数据集的主要特点在于其图像的多样性和标签的明确性。每个图像均为28x28像素的灰度图像,涵盖了从服装到鞋类等多种时尚物品,标签精确对应每个图像的类别。此外,数据集的规模适中,既适合快速实验,也适用于深度学习模型的训练和评估,尤其在图像分类领域具有广泛的应用价值。
使用方法
Fashion-MNIST数据集可用于多种机器学习任务,尤其是图像分类。用户可以通过加载数据集并将其划分为训练集和测试集,利用支持向量机(SVM)或卷积神经网络(CNN)等模型进行分类。数据集支持多种维度缩减技术,如PCA和LDA,以优化模型性能。此外,用户还可以通过调整模型参数,如核函数类型和卷积层结构,进一步提高分类精度。
背景与挑战
背景概述
Fashion-MNIST数据集由Zalando Research团队于近年创建,旨在替代传统的MNIST数据集,专注于时尚物品的图像分类任务。该数据集包含60,000个训练样本和10,000个测试样本,每个样本为28x28像素的灰度图像,并附带10个类别的标签。Fashion-MNIST的引入不仅为图像分类领域提供了新的基准,还推动了机器学习算法在时尚领域的应用,尤其是在深度学习和传统机器学习方法的对比研究中发挥了重要作用。
当前挑战
Fashion-MNIST数据集在构建和应用过程中面临多项挑战。首先,尽管其图像分辨率较低,但时尚物品的多样性和复杂性使得分类任务仍然具有较高的难度。其次,数据集的构建需要确保样本的多样性和代表性,以避免类别偏差。此外,在实际应用中,如何在高维数据中有效降维并保持分类性能,尤其是在使用PCA和LDA等降维技术时,仍是一个技术难题。最后,不同机器学习模型(如SVM和CNN)在处理该数据集时的性能差异和计算成本也是研究的重点,尤其是在模型选择和调优方面存在诸多挑战。
常用场景
经典使用场景
Fashion-MNIST数据集在计算机视觉领域中被广泛应用于图像分类任务,尤其是作为基准数据集来评估和支持向量机(SVM)以及卷积神经网络(CNN)的性能。通过该数据集,研究者可以比较不同模型在时尚图像分类上的表现,如SVM与CNN的对比,以及不同CNN架构(如Resnet、VGGnet、Alexnet)的性能差异。
解决学术问题
Fashion-MNIST数据集解决了传统MNIST数据集在图像分类任务中过于简单的问题,为研究者提供了一个更具挑战性的基准。它不仅帮助评估机器学习模型的分类能力,还促进了深度学习模型在复杂图像数据上的应用研究,推动了计算机视觉领域的发展。
衍生相关工作
基于Fashion-MNIST数据集,研究者们开发了多种改进的图像分类算法和模型架构。例如,通过引入更复杂的CNN模型(如Resnet和VGGnet),研究者们探索了深度学习在时尚图像分类中的潜力。此外,该数据集还激发了对数据增强、迁移学习和模型压缩等技术的研究,进一步推动了计算机视觉领域的创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作