five

Muharaf 手写阿拉伯文数据集

收藏
超神经2024-11-14 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/35487
下载链接
链接失效反馈
官方服务:
资源简介:
Muharaf 数据集是一个专注于手写阿拉伯文识别的机器学习数据集,由 Mehreen Saeed 等人于 2024 年创建,相关论文成果为「Muharaf: Manuscripts of Handwritten Arabic Dataset for Cursive Text Recognition」,已被 NeurIPS 24 接受。这个数据集包含了超过 1.6k 张历史手写页面图像,这些图像由档案阿拉伯语专家转录。每张文档图像都伴随着其文本行的空间多边形坐标以及基本页面元素的信息。 Muharaf 数据集的构建旨在推进手写文本识别 (HTR) 领域的技术进步,不仅针对阿拉伯文手稿,也适用于连体文本的识别。

The Muharaf Dataset is a machine learning dataset dedicated to handwritten Arabic recognition, created by Mehreen Saeed et al. in 2024. Its associated paper titled "Muharaf: Manuscripts of Handwritten Arabic Dataset for Cursive Text Recognition" has been accepted by NeurIPS 24. This dataset contains over 1,600 historical handwritten page images transcribed by archival Arabic language experts. Each document image is accompanied by spatial polygon coordinates of its text lines and information about basic page elements. The Muharaf Dataset was developed to advance technological progress in the field of Handwritten Text Recognition (HTR), targeting both Arabic manuscripts and cursive text recognition scenarios.
创建时间:
2024-11-04
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Muharaf 手写阿拉伯文数据集是一个专注于手写阿拉伯文识别的机器学习数据集,包含超过1.6k张历史手写页面图像,每张图像都有专家转录和空间坐标注释,旨在推进手写文本识别技术。数据集分为公开和受限部分,涵盖多种文档类型,如信件和诗歌,适用于连体文本识别研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务