five

Fraser/mnist-text-small

收藏
Hugging Face2021-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Fraser/mnist-text-small
下载链接
链接失效反馈
官方服务:
资源简介:
MNIST数据集的文本表示版本。原始图像经过最大池化处理,面积缩小至原来的1/4。每个像素被量化为64个字符之一,每个样本包含上下两个版本以鼓励模型学习旋转不变特征。数据集用于测试Transformer-VAEs的插值质量。数据格式包括文本表示和标签。
提供机构:
Fraser
原始信息汇总

数据集概述

数据集名称

MNIST数据集的文本表示版本。

数据处理

  • 图像被调整为原始面积的大约1/4,通过最大池化实现。
  • 每个MNIST像素被量化为64个字符之一。
  • 每个样本有上下两个版本,以促进模型学习旋转不变特征。

数据格式

  • 文本部分:16x14个令牌,总计224个令牌。文本表示的MNIST数字示例:

    00 down ! ! ! ! ! ! ! ! ! ! ! ! ! ! 01 down ! ! ! ! ! ! ! ! ! ! ! ! ! ! 02 down ! ! ! % % C L a ^ ! ! 03 down ! ! ! - Y Q ! ! 04 down ! ! ! % R ^ ! ! ! ! ! 05 down ! ! ! ! $ G ! ! ! ! ! ! ! 06 down ! ! ! ! ! # Y < ! ! ! ! ! 07 down ! ! ! ! ! ! 5 F ! ! ! ! 08 down ! ! ! ! ! ! ! % 1 ! ! ! 09 down ! ! ! ! ! ! F ! ! ! ! 10 down ! ! ! ! 1 4 ! ! ! ! 11 down ! ! L 5 ! ! ! ! ! ! 12 down ! ! V B ! ! ! ! ! ! ! ! 13 down ! ! ! ! ! ! ! ! ! ! ! ! ! !

  • 标签部分:与文本匹配的数字标签。

使用方法

使用.array_to_text().text_to_array()方法测试生成的数据。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作