mnist
收藏TensorFlow Datasets 概述
数据集安装
- 通过
pip install tensorflow-datasets安装。 - 需要预先安装
tensorflow或tensorflow-gpu。 - 部分数据集可能需要额外的库,具体信息见
setup.py中的extras_require。
数据集使用
-
使用
tensorflow_datasets.list_builders()查看可用数据集。 -
通过
tensorflow_datasets.load(name, split, data_dir, download=True)加载数据集。 -
数据集操作示例: python import tensorflow_datasets as tfds
dataset = tfds.load(name="mnist", split=tfds.Split.TRAIN, data_dir="~/tfdata", download=True) dataset = dataset.shuffle(1000).batch(128).prefetch(1) features = dataset.make_one_shot_iterator().get_next() image, label = features["input"], features["target"]
DatasetBuilder
-
所有数据集通过
DatasetBuilder类实现。 -
示例: python import tensorflow_datasets as tfds
mnist_builder = tfds.builder("mnist")(data_dir="~/tfdata") mnist_builder.download_and_prepare() dataset = mnist_builder.as_dataset(split=tfds.Split.TRAIN)
非TensorFlow使用
-
数据集可通过
numpy_iterator方法在非TensorFlow环境中使用。 -
示例: python import tensorflow_datasets as tfds
mnist_builder = tfds.builder("mnist")(data_dir="~/tfdata") mnist_builder.download_and_prepare() for element in mnist_builder.numpy_iterator(split=tfds.Split.TRAIN): numpy_image, numpy_label = element["input"], element["target"]




