71,535张英文自然场景OCR数据
收藏国家数据集管理服务平台2026-04-28 更新2026-04-29 收录
下载链接:
https://www.ndsms.cn/dataRetrieval/datasetDetail/?id=78b4cda42620dde71ba3d62aae370206
下载链接
链接失效反馈官方服务:
资源简介:
71,535张英文自然场景OCR数据采集场景为英国和美国实地采集。数据多样性包括多种场景、多种拍摄角度、多种光照条件。 在标注方面,对英文OCR数据进行行级&单词级&字符级矩形框(或四边形框)标注,并对文本内容进行转写。本套英文自然场景OCR数据可用英文自然场景下的OCR任务。
71,535 English natural scene OCR data samples were collected via on-site field surveys in the United Kingdom and the United States. The data exhibits substantial diversity, covering various scenarios, shooting angles, and lighting conditions. For annotation, the English OCR data samples were annotated with line-level, word-level, and character-level rectangular (or quadrilateral) bounding boxes, and their corresponding text contents were transcribed. This English natural scene OCR dataset can be utilized for OCR tasks in natural scene scenarios.
提供机构:
数据堂(北京)科技股份有限公司
创建时间:
2026-04-28
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含71,535张在英国和美国实地采集的英文自然场景图像,适用于OCR任务。数据涵盖了多种场景、拍摄角度和光照条件,并提供了行级、单词级及字符级的矩形框(或四边形框)标注与文本内容转写。
以上内容由遇见数据集搜集并总结生成



