Fraser/mnist-text-small
收藏Hugging Face2021-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Fraser/mnist-text-small
下载链接
链接失效反馈官方服务:
资源简介:
MNIST数据集的文本表示版本。原始图像经过最大池化处理,面积缩小至原来的1/4。每个像素被量化为64个字符之一,每个样本包含上下两个版本以鼓励模型学习旋转不变特征。数据集用于测试Transformer-VAEs的插值质量。数据格式包括文本表示和标签。
提供机构:
Fraser
原始信息汇总
数据集概述
数据集名称
MNIST数据集的文本表示版本。
数据处理
- 图像被调整为原始面积的大约1/4,通过最大池化实现。
- 每个MNIST像素被量化为64个字符之一。
- 每个样本有上下两个版本,以促进模型学习旋转不变特征。
数据格式
-
文本部分:16x14个令牌,总计224个令牌。文本表示的MNIST数字示例:
00 down ! ! ! ! ! ! ! ! ! ! ! ! ! ! 01 down ! ! ! ! ! ! ! ! ! ! ! ! ! ! 02 down ! ! ! % % C L a ^ ! ! 03 down ! ! ! -
YQ ! ! 04 down ! ! ! %R ^ ! ! ! ! ! 05 down ! ! ! ! $ G! ! ! ! ! ! ! 06 down ! ! ! ! ! #Y < ! ! ! ! ! 07 down ! ! ! ! ! ! 5F ! ! ! ! 08 down ! ! ! ! ! ! ! %1 ! ! ! 09 down ! ! ! ! ! ! F! ! ! ! 10 down ! ! ! ! 14 ! ! ! ! 11 down ! ! L5 ! ! ! ! ! ! 12 down ! !V B ! ! ! ! ! ! ! ! 13 down ! ! ! ! ! ! ! ! ! ! ! ! ! ! -
标签部分:与文本匹配的数字标签。
使用方法
使用.array_to_text()和.text_to_array()方法测试生成的数据。



