five

BanglaWriting

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/BanglaWriting
下载链接
链接失效反馈
官方服务:
资源简介:
BanglaWriting 数据集包含 260 个不同性格和年龄的人的单页笔迹。每个页面都包含限制每个单词的边界框,以及文字的 unicode 表示。该数据集总共包含 21,234 个单词和 32,787 个字符。此外,该数据集包括 5,470 个孟加拉语词汇的独特单词。除常用词外,该数据集包括 261 个可理解的覆盖和 450 个不可理解的覆盖。所有的边界框和单词标签都是手动生成的。该数据集可用于复杂的光学字符/单词识别、作家识别和手写分词。此外,该数据集适用于提取基于年龄和基于性别的笔迹变化。
提供机构:
OpenDataLab
创建时间:
2022-06-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
BanglaWriting数据集收集了260位不同年龄和性格个体的单页手写样本,包含手动标注的单词边界框和Unicode文本,总计21,234个单词和32,787个字符。该数据集适用于光学字符识别、作家识别和手写分析等研究任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作