BanglaWriting
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/BanglaWriting
下载链接
链接失效反馈官方服务:
资源简介:
BanglaWriting 数据集包含 260 个不同性格和年龄的人的单页笔迹。每个页面都包含限制每个单词的边界框,以及文字的 unicode 表示。该数据集总共包含 21,234 个单词和 32,787 个字符。此外,该数据集包括 5,470 个孟加拉语词汇的独特单词。除常用词外,该数据集包括 261 个可理解的覆盖和 450 个不可理解的覆盖。所有的边界框和单词标签都是手动生成的。该数据集可用于复杂的光学字符/单词识别、作家识别和手写分词。此外,该数据集适用于提取基于年龄和基于性别的笔迹变化。
提供机构:
OpenDataLab
创建时间:
2022-06-23
搜集汇总
数据集介绍

背景与挑战
背景概述
BanglaWriting数据集收集了260位不同年龄和性格个体的单页手写样本,包含手动标注的单词边界框和Unicode文本,总计21,234个单词和32,787个字符。该数据集适用于光学字符识别、作家识别和手写分析等研究任务。
以上内容由遇见数据集搜集并总结生成



