EMNIST-Balanced|手写文字识别数据集|图像识别数据集
收藏数据集概述
EMNIST系列
- EMNIST-Balanced: 包含131,600个字符,分为47个平衡类别。
- EMNIST-ByClass: 包含814,255个字符,分为62个不平衡类别。
- EMNIST-ByMerge: 包含814,255个字符,分为47个不平衡类别。
- EMNIST-Digits: 包含280,000个字符,分为10个平衡类别(仅数字)。
- EMNIST-Letters: 包含145,600个字符,分为26个平衡类别(仅字母)。
- EMNIST-MNIST: 包含70,000个字符,分为10个平衡类别(等同于
keras.datasets.mnist)。
KMNIST系列
- KMNIST-KMNIST: 包含70,000个28x28灰度图像,为日本Kuzushiji字符。
- KMNIST-K49: 包含270,912个图像,分为49个类别。
SVHN系列
- SVHN-Normal: 包含73,257个训练图像和26,032个测试图像,非商业用途。
- SVHN-Extra: 包含604,388个训练图像和26,032个测试图像,非商业用途。
其他数据集
- STL-10: 包含5,000个训练图像和8,000个测试图像,共10个类别。
- Iris: 包含150个实例,分为3个类别,每个类别50个实例。
- Wine Quality dataset: 包含葡萄酒的物理化学测试数据,用于模型葡萄酒质量。
- USPS Handwritten Digits Dataset: 包含数千个16x16灰度图像的手写数字。
数据集使用方法
依赖
- 确保安装了TensorFlow。
安装步骤
- 使用PIP安装:
pip install extra-keras-datasets。
数据集加载示例
EMNIST-Balanced
python from extra_keras_datasets import emnist (input_train, target_train), (input_test, target_test) = emnist.load_data(type=balanced)
KMNIST-KMNIST
python from extra_keras_datasets import kmnist (input_train, target_train), (input_test, target_test) = kmnist.load_data(type=kmnist)
SVHN-Normal
python from extra_keras_datasets import svhn (input_train, target_train), (input_test, target_test) = svhn.load_data(type=normal)
STL-10
python from extra_keras_datasets import stl10 (input_train, target_train), (input_test, target_test) = stl10.load_data()
Iris
python from extra_keras_datasets import iris (input_train, target_train), (input_test, target_test) = iris.load_data(test_split=0.2)
Wine Quality dataset
python from extra_keras_datasets import wine_quality (input_train, target_train), (input_test, target_test) = wine_quality.load_data(which_data=both, test_split=0.2, shuffle=True)
USPS Handwritten Digits Dataset
python from extra_keras_datasets import usps (input_train, target_train), (input_test, target_test) = usps.load_data()




