five

10,020张阿拉伯语自然场景OCR数据【数据堂】

收藏
OpenDataLab2024-05-31 更新2024-06-01 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang1306
下载链接
链接失效反馈
官方服务:
资源简介:
10,020张阿拉伯语自然场景OCR数据包括多种自然场景、多种拍摄角度。在标注方面,标注行级文本的四边形框,行级文本转写。本套数据可用于阿拉伯语言国家OCR任务

Arabic natural scene OCR dataset consisting of 10,020 samples, covering various natural scenes and different shooting angles. For annotation, it provides quadrilateral bounding boxes for line-level text and the corresponding transcriptions of the line-level text. This dataset can be used for OCR tasks in Arabic-speaking countries.
提供机构:
shujutang
创建时间:
2024-05-31
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含10,020张阿拉伯语自然场景OCR图像,采集自商店牌匾、站牌、海报等多种场景,使用手机和相机拍摄,涵盖不同拍摄角度。数据以.jpg格式存储,标注为.json文件,包括行级四边形框和文本转写,检测和转写精度均不低于97%,为商业数据,仅限企业合作购买。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务