14,511张英文手写体OCR数据【数据堂】
收藏OpenDataLab2024-05-30 更新2024-06-01 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang1215
下载链接
链接失效反馈官方服务:
资源简介:
14,511张英文手写体OCR数据。文字载体为A4纸、横格纸、英文纸等。采集设备为手机,采集角度为平视视角。该数据内容涵盖英文作文、诗歌、散文、新闻、故事等领域。在标注方面,标注行级文本的四边形框,行级文本转写。本套数据可用于英文手写体OCR任务
This dataset contains 14,511 English handwritten text OCR instances. The text is written on various carriers including A4 paper, ruled paper, and English writing paper. All data was collected using mobile phones with an eye-level shooting perspective. The dataset covers a wide range of content domains such as English compositions, poems, prose works, news articles, and stories. For annotation, quadrilateral bounding boxes for line-level text and corresponding line-level text transcriptions are provided. This dataset is suitable for English handwritten OCR tasks.
提供机构:
shujutang
创建时间:
2024-05-30
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含14,511张英文手写体图像,采集自1,591名不同国籍的参与者,涵盖作文、诗歌、散文等多种文本类型。数据采用行级四边形框和文本转写进行标注,精度不低于97%,适用于英文手写体OCR任务,但仅限企业合作购买使用。
以上内容由遇见数据集搜集并总结生成



