MNIST
收藏数据集概述
TensorFlow Datasets 提供了多种公共数据集,这些数据集可以通过 tf.data.Datasets 接口访问。
数据集列表
- 访问链接:数据集列表
数据集使用示例
- 在 Colab 中尝试:Colab 示例
数据集API文档
- API 文档链接:API 文档
数据集操作指南
数据集安装与使用
安装
- 使用命令:
pip install tensorflow-datasets - 需要 TensorFlow 1.15+ 版本
使用示例
python import tensorflow_datasets as tfds import tensorflow as tf
查看可用数据集
print(tfds.list_builders())
加载数据集
ds_train = tfds.load(name="mnist", split="train", shuffle_files=True)
构建输入管道
ds_train = ds_train.shuffle(1000).batch(128).prefetch(10) for features in ds_train.take(1): image, label = features["image"], features["label"]
数据集构建器 (DatasetBuilder)
所有数据集都实现为 DatasetBuilder 的子类,并通过 tfds.load 进行加载。
python import tensorflow_datasets as tfds
获取 DatasetBuilder 类
mnist_builder = tfds.builder(mnist)
下载并准备数据集
mnist_builder.download_and_prepare()
构建 tf.data.Dataset
ds = mnist_builder.as_dataset(split=train)
获取 DatasetInfo 对象
info = mnist_builder.info print(info)
NumPy 使用 (tfds.as_numpy)
使用 tfds.as_numpy 可以将 tf.data.Dataset 转换为生成 NumPy 数组的生成器。
python train_ds = tfds.load("mnist", split="train") train_ds = train_ds.shuffle(1024).batch(128).repeat(5).prefetch(10) for example in tfds.as_numpy(train_ds): numpy_images, numpy_labels = example["image"], example["label"]
请求特定数据集




