five

Nexdata/14511_Images_English_Handwriting_OCR_Data

收藏
Hugging Face2024-04-16 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/14511_Images_English_Handwriting_OCR_Data
下载链接
链接失效反馈
官方服务:
资源简介:
14,511张英文手写OCR数据。文本载体包括A4纸、横格纸、英文纸等。收集设备为手机,收集角度为眼平角度。数据集内容包括英文作文、诗歌、散文、新闻、故事等。注释包括行级别的四边形边界框和文本转录。数据集可用于英文手写OCR等任务。

The dataset includes 14,511 images of English handwriting OCR data, with text carriers such as A4 paper, lined paper, and English paper. The collection device is a cellphone, and the collection angle is eye-level. The dataset content includes English compositions, poetry, prose, news, stories, etc. The data has been annotated with line-level quadrilateral bounding boxes and text transcriptions. The dataset is suitable for tasks such as English handwriting OCR. The data is provided by 1,591 people, with gender distribution of 659 males and 932 females, and age distribution of 30 people under 18 years old, 1,479 people aged from 18 to 45 years old, and 82 people aged from 46 to 60 years old. Nationality distribution includes America, Philippines, India, France, Egypt, Pakistan, Zimbabwe, etc. The image data format is .jpg or .jpeg, and the annotation file format is .json. The accuracy of the collection content and text transcriptions is not less than 97%.
提供机构:
Nexdata
原始信息汇总

数据集描述

14,511张英文手写OCR数据图像。文本载体包括A4纸、横线纸、英文纸等。采集设备为手机,采集角度为平视角度。数据集内容包括英文作文、诗歌、散文、新闻、故事等。数据标注包括行级四边形边界框标注和文本转录。该数据集可用于英文手写OCR等任务。

数据规模

1,591人,14,511张图像。

人口分布

  • 性别分布:659名男性,932名女性。
  • 年龄分布:30人年龄在18岁以下,1,479人年龄在18至45岁之间,82人年龄在46至60岁之间。

国籍分布

包括美国、菲律宾、印度、法国、埃及、巴基斯坦、津巴布韦等。

采集环境

A4纸、横线纸、英文纸等。

设备

手机。

拍摄角度

平视角度。

数据格式

图像数据格式为.jpg或.jpeg,标注文件格式为.json。

数据内容

包括英文作文、诗歌、散文、新闻、故事等。

标注内容

行级四边形边界框标注和文本转录。

准确性

采集内容准确性不低于97%;文本转录准确性不低于97%。

许可信息

商业许可。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作