five

wwydmanski/tabular-letter-recognition

收藏
Hugging Face2023-02-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/wwydmanski/tabular-letter-recognition
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集的目的是识别大量黑白矩形像素显示为英文字母表中的26个大写字母之一。数据集包含20,000个独特的刺激物,每个刺激物被转换为16个原始数值属性,并缩放到0到15的整数范围内。通常使用前16,000个数据进行训练,剩余的4,000个数据用于预测字母类别。属性信息包括水平位置、垂直位置、宽度、高度、总像素数、像素均值、像素方差、像素相关性等16个属性。

该数据集的目的是识别大量黑白矩形像素显示为英文字母表中的26个大写字母之一。数据集包含20,000个独特的刺激物,每个刺激物被转换为16个原始数值属性,并缩放到0到15的整数范围内。通常使用前16,000个数据进行训练,剩余的4,000个数据用于预测字母类别。属性信息包括水平位置、垂直位置、宽度、高度、总像素数、像素均值、像素方差、像素相关性等16个属性。
提供机构:
wwydmanski
原始信息汇总

数据集概述

基本信息

  • 任务类别:表格分类(tabular-classification)
  • 标签:表格(tabular)
  • 美观名称:表格字母识别(Tabular letter recognition)
  • 大小类别:数据量介于1万至10万之间(10K<n<100K)

数据集来源

  • 创建者:David J. Slate
  • 创建者联系信息:Odesta Corporation; 1890 Maple Ave; Suite 115; Evanston, IL 60201

数据集信息

  • 目标:识别大量黑白矩形像素显示为26个英文字母中的一个。
  • 数据生成:基于20种不同字体,每个字母在这些字体中随机扭曲,生成20,000个独特的刺激。
  • 数据处理:每个刺激转换为16个基本数值属性(统计时刻和边缘计数),然后缩放到整数值范围0至15。
  • 训练与测试:通常使用前16,000个项目进行训练,然后用得到的模型预测剩余4,000个项目的字母类别。

属性信息

  1. x-box:框的水平位置(整数)
  2. y-box:框的垂直位置(整数)
  3. width:框的宽度(整数)
  4. high:框的高度(整数)
  5. onpix:总像素数(整数)
  6. x-bar:框内激活像素的x平均值(整数)
  7. y-bar:框内激活像素的y平均值(整数)
  8. x2bar:x的平均方差(整数)
  9. y2bar:y的平均方差(整数)
  10. xybar:x和y的平均相关性(整数)
  11. x2ybr:x平方乘以y的平均值(整数)
  12. xy2br:x乘以y平方的平均值(整数)
  13. x-ege:从左到右的边缘计数平均值(整数)
  14. xegvy:x-ege与y的相关性(整数)
  15. y-ege:从下到上的边缘计数平均值(整数)
  16. yegvx:y-ege与x的相关性(整数)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作