wwydmanski/tabular-letter-recognition

Name: wwydmanski/tabular-letter-recognition
Creator: wwydmanski
Published: 2023-02-24 09:36:30
License: 暂无描述

Hugging Face2023-02-24 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/wwydmanski/tabular-letter-recognition

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集的目的是识别大量黑白矩形像素显示为英文字母表中的26个大写字母之一。数据集包含20,000个独特的刺激物，每个刺激物被转换为16个原始数值属性，并缩放到0到15的整数范围内。通常使用前16,000个数据进行训练，剩余的4,000个数据用于预测字母类别。属性信息包括水平位置、垂直位置、宽度、高度、总像素数、像素均值、像素方差、像素相关性等16个属性。

提供机构：

wwydmanski

原始信息汇总

数据集概述

基本信息

任务类别：表格分类（tabular-classification）
标签：表格（tabular）
美观名称：表格字母识别（Tabular letter recognition）
大小类别：数据量介于1万至10万之间（10K<n<100K）

数据集来源

创建者：David J. Slate
创建者联系信息：Odesta Corporation; 1890 Maple Ave; Suite 115; Evanston, IL 60201

数据集信息

目标：识别大量黑白矩形像素显示为26个英文字母中的一个。
数据生成：基于20种不同字体，每个字母在这些字体中随机扭曲，生成20,000个独特的刺激。
数据处理：每个刺激转换为16个基本数值属性（统计时刻和边缘计数），然后缩放到整数值范围0至15。
训练与测试：通常使用前16,000个项目进行训练，然后用得到的模型预测剩余4,000个项目的字母类别。

属性信息

x-box：框的水平位置（整数）
y-box：框的垂直位置（整数）
width：框的宽度（整数）
high：框的高度（整数）
onpix：总像素数（整数）
x-bar：框内激活像素的x平均值（整数）
y-bar：框内激活像素的y平均值（整数）
x2bar：x的平均方差（整数）
y2bar：y的平均方差（整数）
xybar：x和y的平均相关性（整数）
x2ybr：x平方乘以y的平均值（整数）
xy2br：x乘以y平方的平均值（整数）
x-ege：从左到右的边缘计数平均值（整数）
xegvy：x-ege与y的相关性（整数）
y-ege：从下到上的边缘计数平均值（整数）
yegvx：y-ege与x的相关性（整数）

5,000+

优质数据集

54 个

任务类型

进入经典数据集