mnist-text-small
收藏魔搭社区2025-12-02 更新2025-07-12 收录
下载链接:
https://modelscope.cn/datasets/pandas007/mnist-text-small
下载链接
链接失效反馈官方服务:
资源简介:
MNIST dataset adapted to a text-based representation.
Modified images to be ~1/4 the original area.
Done by taking a max pool.
This allows testing interpolation quality for Transformer-VAEs.
System is heavily inspired by Matthew Rayfield's work https://youtu.be/Z9K3cwSL6uM
Works by quantising each MNIST pixel into one of 64 characters.
Every sample has an up & down version to encourage the model to learn rotation invarient features.
Use `.array_to_text(` and `.text_to_array(` methods to test your generated data.
Data format:
- text: (16 x 14 tokens, 224 tokens total): Textual representation of MNIST digit, for example:
```
00 down ! ! ! ! ! ! ! ! ! ! ! ! ! !
01 down ! ! ! ! ! ! ! ! ! ! ! ! ! !
02 down ! ! ! ! ! ! % % C L a ^ ! !
03 down ! ! ! - ` ` ` ` ` Y ` Q ! !
04 down ! ! ! % ` ` ` R ^ ! ! ! ! !
05 down ! ! ! ! $ G ` ! ! ! ! ! ! !
06 down ! ! ! ! ! # ` Y < ! ! ! ! !
07 down ! ! ! ! ! ! 5 ` ` F ! ! ! !
08 down ! ! ! ! ! ! ! % ` ` 1 ! ! !
09 down ! ! ! ! ! ! F ` ` ` ! ! ! !
10 down ! ! ! ! 1 ` ` ` ` 4 ! ! ! !
11 down ! ! L ` ` ` ` 5 ! ! ! ! ! !
12 down ! ! ` ` V B ! ! ! ! ! ! ! !
13 down ! ! ! ! ! ! ! ! ! ! ! ! ! !
```
- label: Just a number with the texts matching label.
本数据集为适配文本表征形式的MNIST数据集。
将原始图像调整至原面积的约1/4,通过最大池化(max pool)操作实现。该设置可用于测试Transformer变分自编码器(Transformer-VAE)的插值质量。
本数据集的设计大量借鉴了Matthew Rayfield的相关研究(https://youtu.be/Z9K3cwSL6uM)。
其实现方式为将每张MNIST图像的每个像素量化为64个字符中的一个。每个样本均包含正向与上下翻转版本,以助力模型学习旋转不变特征。
可通过`.array_to_text(`与`.text_to_array(`方法对生成的数据进行测试。
## 数据格式:
- 文本(text):由16×14个Token组成,总计224个Token,为MNIST手写数字的文本表征形式,示例如下:
00 down ! ! ! ! ! ! ! ! ! ! ! ! ! !
01 down ! ! ! ! ! ! ! ! ! ! ! ! ! !
02 down ! ! ! ! ! ! % % C L a ^ ! !
03 down ! ! ! - ` ` ` ` ` Y ` Q ! !
04 down ! ! ! % ` ` ` R ^ ! ! ! ! !
05 down ! ! ! ! $ G ` ! ! ! ! ! ! !
06 down ! ! ! ! ! # ` Y < ! ! ! ! !
07 down ! ! ! ! ! ! 5 ` ` F ! ! ! !
08 down ! ! ! ! ! ! ! % ` ` 1 ! ! !
09 down ! ! ! ! ! ! F ` ` ` ! ! ! !
10 down ! ! ! ! 1 ` ` ` ` 4 ! ! ! !
11 down ! ! L ` ` ` ` 5 ! ! ! ! ! !
12 down ! ! ` ` V B ! ! ! ! ! ! ! !
13 down ! ! ! ! ! ! ! ! ! ! ! ! ! !
- 标签(label):为与对应文本匹配的数字编号。
提供机构:
maas
创建时间:
2025-07-07



