gymprathap/Handwriting-Recognition-Dataset
收藏Hugging Face2024-06-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gymprathap/Handwriting-Recognition-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从慈善活动中获得的超过四十万个手写名字。字符识别技术用于将扫描文档上的字符转换为数字格式,通常在处理机器打印字体时表现良好。然而,由于个人书写风格的巨大差异,机器在准确识别手写字符方面仍面临重大挑战。数据集中的名字总数为206,799个,姓氏总数为207,024个。数据被分为训练集(331,059个样本)、测试集(41,382个样本)和验证集(41,382个样本)。
该数据集包含从慈善活动中获得的超过四十万个手写名字。字符识别技术用于将扫描文档上的字符转换为数字格式,通常在处理机器打印字体时表现良好。然而,由于个人书写风格的巨大差异,机器在准确识别手写字符方面仍面临重大挑战。数据集中的名字总数为206,799个,姓氏总数为207,024个。数据被分为训练集(331,059个样本)、测试集(41,382个样本)和验证集(41,382个样本)。
提供机构:
gymprathap
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 标记分类
- 语言: 英语
- 标签: 代码
- 美观名称: Handwriting Recognition Dataset
- 数据量: 1K<n<10K
数据内容
- 数据来源: 慈善活动收集的手写姓名
- 总姓氏数: 207,024
- 总名字数: 206,799
- 数据划分:
- 训练集: 331,059 样本
- 测试集: 41,382 样本
- 验证集: 41,382 样本
数据特点
- 识别挑战: 由于个人书写风格的多样性,机器在识别手写文字时仍面临较大挑战。



