MNIST
收藏数据集概述
数据集提供
- 平台:TensorFlow Datasets
- 功能:提供多种公共数据集作为
tf.data.Datasets。
数据集列表
- 链接:数据集列表
数据集使用示例
-
示例代码: python import tensorflow_datasets as tfds import tensorflow as tf
查看可用数据集
print(tfds.list_builders())
加载数据集
ds_train = tfds.load(name="mnist", split="train", shuffle_files=True)
构建输入管道
ds_train = ds_train.shuffle(1000).batch(128).prefetch(10) for features in ds_train.take(1): image, label = features["image"], features["label"]
数据集构建
- 实现:所有数据集作为
DatasetBuilder的子类实现。 - 文档:DatasetBuilder
数据集信息示例
-
MNIST数据集信息:
tfds.core.DatasetInfo( name=mnist, version=1.0.0, description=The MNIST database of handwritten digits., homepage=http://yann.lecun.com/exdb/mnist/, features=FeaturesDict({ image: Image(shape=(28, 28, 1), dtype=tf.uint8), label: ClassLabel(shape=(), dtype=tf.int64, num_classes=10) }, total_num_examples=70000, splits={ test: <tfds.core.SplitInfo num_examples=10000>, train: <tfds.core.SplitInfo num_examples=60000> }, supervised_keys=(image, label), citation=""" @article{lecun2010mnist, title={MNIST handwritten digit database}, author={LeCun, Yann and Cortes, Corinna and Burges, CJ}, journal={ATT Labs [Online]. Available: http://yann. lecun. com/exdb/mnist}, volume={2}, year={2010} } """, )
NumPy使用
- 功能:使用
tfds.as_numpy从tf.data.Dataset获取NumPy数组记录。 - 示例代码: python train_ds = tfds.load("mnist", split="train") train_ds = train_ds.shuffle(1024).batch(128).repeat(5).prefetch(10) for example in tfds.as_numpy(train_ds): numpy_images, numpy_labels = example["image"], example["label"]
数据集请求




