five

gymprathap/Handwriting-Recognition-Dataset

收藏
Hugging Face2024-06-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gymprathap/Handwriting-Recognition-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从慈善活动中获得的超过四十万个手写名字。字符识别技术用于将扫描文档上的字符转换为数字格式,通常在处理机器打印字体时表现良好。然而,由于个人书写风格的巨大差异,机器在准确识别手写字符方面仍面临重大挑战。数据集中的名字总数为206,799个,姓氏总数为207,024个。数据被分为训练集(331,059个样本)、测试集(41,382个样本)和验证集(41,382个样本)。

该数据集包含从慈善活动中获得的超过四十万个手写名字。字符识别技术用于将扫描文档上的字符转换为数字格式,通常在处理机器打印字体时表现良好。然而,由于个人书写风格的巨大差异,机器在准确识别手写字符方面仍面临重大挑战。数据集中的名字总数为206,799个,姓氏总数为207,024个。数据被分为训练集(331,059个样本)、测试集(41,382个样本)和验证集(41,382个样本)。
提供机构:
gymprathap
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 标记分类
  • 语言: 英语
  • 标签: 代码
  • 美观名称: Handwriting Recognition Dataset
  • 数据量: 1K<n<10K

数据内容

  • 数据来源: 慈善活动收集的手写姓名
  • 总姓氏数: 207,024
  • 总名字数: 206,799
  • 数据划分:
    • 训练集: 331,059 样本
    • 测试集: 41,382 样本
    • 验证集: 41,382 样本

数据特点

  • 识别挑战: 由于个人书写风格的多样性,机器在识别手写文字时仍面临较大挑战。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作