filwsyl/video_tags
收藏Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/filwsyl/video_tags
下载链接
链接失效反馈官方服务:
资源简介:
MNIST数据集包含70,000张28x28的黑白手写数字图像,分为60,000张训练图像和10,000张验证图像。这些图像来源于两个NIST数据库,分别由美国人口普查局员工和高中生绘制。数据集的主要任务是图像分类,即将手写数字图像分类为0到9的10个类别。数据集的创建目的是为模式识别方法和机器学习算法提供一个预处理和格式化工作量最小的测试平台。
The MNIST dataset consists of 70,000 28×28 grayscale handwritten digit images, partitioned into 60,000 training images and 10,000 validation images. These images are sourced from two NIST databases, and were hand-drawn respectively by employees of the U.S. Census Bureau and high school students. The primary task of this dataset is image classification, i.e., categorizing handwritten digit images into 10 classes ranging from 0 to 9. The dataset was developed to provide a testbed with minimal preprocessing and formatting overhead for pattern recognition methods and machine learning algorithms.
提供机构:
filwsyl
原始信息汇总
数据集概述
数据集基本信息
- 名称: MNIST
- 语言: 英语
- 许可证: MIT
- 多语言性: 单语种
- 大小: 10K<n<100K
- 任务类别: 图像分类
- 任务ID: 多类别图像分类
- 论文代码ID: mnist
数据集描述
数据集摘要
- 内容: MNIST数据集包含70,000张28x28像素的手写数字黑白图像,分为60,000张训练图像和10,000张验证图像。每个数字类别包含7,000张图像,其中6,000张用于训练,1,000张用于测试。
- 来源: 图像来源于美国人口普查局员工和高中学生,两组各占一半。
支持的任务和排行榜
- 任务: 图像分类
- 目标: 将手写数字图像分类为0到9的整数类别。
- 排行榜: 链接
数据集结构
数据实例
-
组成: 每个数据点包括一个图像及其标签。
-
示例:
{ image: <PIL.PngImagePlugin.PngImageFile image mode=L size=28x28 at 0x276021F6DD8>, label: 5 }
数据字段
- 图像: 28x28像素的图像,类型为
PIL.Image.Image。 - 标签: 整数,范围从0到9。
数据分割
- 分割: 数据分为训练集和测试集,训练集包含60,000张图像,测试集包含10,000张图像。
数据集创建
来源数据
- 初始数据收集和标准化: 原始图像被标准化为20x20像素,然后居中于28x28像素的框内。
- 源语言生产者: 图像由美国人口普查局员工和高中学生绘制。
注释
- 注释过程: 图像创建者在绘制图像后为其添加标签。
- 注释者: 与源数据创建者相同。
许可证信息
- 类型: MIT许可证
引用信息
@article{lecun2010mnist, title={MNIST handwritten digit database}, author={LeCun, Yann and Cortes, Corinna and Burges, CJ}, journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist}, volume={2}, year={2010} }



