wwydmanski/tabular-letter-recognition
收藏Hugging Face2023-02-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/wwydmanski/tabular-letter-recognition
下载链接
链接失效反馈官方服务:
资源简介:
该数据集的目的是识别大量黑白矩形像素显示为英文字母表中的26个大写字母之一。数据集包含20,000个独特的刺激物,每个刺激物被转换为16个原始数值属性,并缩放到0到15的整数范围内。通常使用前16,000个数据进行训练,剩余的4,000个数据用于预测字母类别。属性信息包括水平位置、垂直位置、宽度、高度、总像素数、像素均值、像素方差、像素相关性等16个属性。
该数据集的目的是识别大量黑白矩形像素显示为英文字母表中的26个大写字母之一。数据集包含20,000个独特的刺激物,每个刺激物被转换为16个原始数值属性,并缩放到0到15的整数范围内。通常使用前16,000个数据进行训练,剩余的4,000个数据用于预测字母类别。属性信息包括水平位置、垂直位置、宽度、高度、总像素数、像素均值、像素方差、像素相关性等16个属性。
提供机构:
wwydmanski
原始信息汇总
数据集概述
基本信息
- 任务类别:表格分类(tabular-classification)
- 标签:表格(tabular)
- 美观名称:表格字母识别(Tabular letter recognition)
- 大小类别:数据量介于1万至10万之间(10K<n<100K)
数据集来源
- 创建者:David J. Slate
- 创建者联系信息:Odesta Corporation; 1890 Maple Ave; Suite 115; Evanston, IL 60201
数据集信息
- 目标:识别大量黑白矩形像素显示为26个英文字母中的一个。
- 数据生成:基于20种不同字体,每个字母在这些字体中随机扭曲,生成20,000个独特的刺激。
- 数据处理:每个刺激转换为16个基本数值属性(统计时刻和边缘计数),然后缩放到整数值范围0至15。
- 训练与测试:通常使用前16,000个项目进行训练,然后用得到的模型预测剩余4,000个项目的字母类别。
属性信息
- x-box:框的水平位置(整数)
- y-box:框的垂直位置(整数)
- width:框的宽度(整数)
- high:框的高度(整数)
- onpix:总像素数(整数)
- x-bar:框内激活像素的x平均值(整数)
- y-bar:框内激活像素的y平均值(整数)
- x2bar:x的平均方差(整数)
- y2bar:y的平均方差(整数)
- xybar:x和y的平均相关性(整数)
- x2ybr:x平方乘以y的平均值(整数)
- xy2br:x乘以y平方的平均值(整数)
- x-ege:从左到右的边缘计数平均值(整数)
- xegvy:x-ege与y的相关性(整数)
- y-ege:从下到上的边缘计数平均值(整数)
- yegvx:y-ege与x的相关性(整数)



