ckg/mnist-for-diffusion
收藏Hugging Face2024-07-05 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/ckg/mnist-for-diffusion
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为MNIST for Diffusion,旨在用于训练扩散模型。数据集包含原始MNIST数据集的图像和对应的类别标签,其中一半数据集的类别标签为数字形式(如“1”),另一半为自然语言形式(如“one”)。这种数据增强方式使得样本数量翻倍,并且在训练U-Net模型时使用预训练的文本编码器可能会产生有趣的结果。数据集包含140,000个训练样本,总大小为39,858,266字节。
The dataset, named MNIST for Diffusion, is designed for training diffusion models. It contains images from the original MNIST dataset along with their corresponding class labels, where half of the dataset has class labels in numeric form (e.g., 1) and the other half in natural language form (e.g., one). This data augmentation doubles the number of samples and may yield interesting results when training a U-Net model with a frozen, pre-trained text encoder. The dataset includes 140,000 training samples with a total size of 39,858,266 bytes.
提供机构:
ckg
原始信息汇总
MNIST for Diffusion 数据集概述
数据集信息
- 特征:
image: 图像数据,数据类型为image。text: 文本数据,数据类型为string。
- 分割:
train: 训练集,包含 140000 个样本,总大小为 39858266 字节。
- 下载大小: 37136812 字节。
- 数据集大小: 39858266 字节。
- 配置:
default: 默认配置,包含训练集数据文件路径data/train-*。
- 许可证: cc。
- 规模类别: 100K < n < 1M。
数据集描述
- 该数据集包含两个版本的 MNIST 训练集和测试集。
- 第一个版本包含 MNIST 图像及其对应的字符串化类别 ID(例如:"1")。
- 第二个版本包含 MNIST 图像及其对应的自然语言类别名称(例如:"one")。
- 这种数据增强方式将样本数量翻倍,适合用于训练 U-Net 模型,并结合预训练的文本编码器进行冻结训练。



