five

105,941张12种语言自然场景OCR数据

收藏
数据堂2024-05-23 收录
下载链接:
https://www.datatang.com/dataset/1064
下载链接
链接失效反馈
官方服务:
资源简介:
105,941张12种语言自然场景OCR数据涵盖12种语言,包括6种亚洲语、6种欧洲语,采集覆盖多种自然场景、多种拍摄角度。在标注方面,标注行级文本的四边形框,行级文本转写。本套数据可用于多国语言OCR任务。

105,941 natural scene OCR data samples covering 12 languages, including 6 Asian languages and 6 European languages. The data was collected across diverse natural scenes and various shooting angles. For annotation, quadrilateral bounding boxes are employed to localize line-level text, and line-level text transcription is also completed. This dataset can be utilized for multilingual OCR tasks.
提供机构:
数据堂
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含105,941张12种语言的自然场景OCR数据,涵盖6种亚洲语言和6种欧洲语言,采集环境多样,包括商店牌匾、路标等多种场景。标注内容包括行级文本的四边形框和转写,检测框和文本转写精度均不低于97%,适用于多国语言OCR任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务