Nexdata/10020_Images_of_Arabic_Natural_Scene_OCR_Data
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/10020_Images_of_Arabic_Natural_Scene_OCR_Data
下载链接
链接失效反馈官方服务:
资源简介:
10,020个阿拉伯语自然场景OCR数据,包含多种自然场景和多个拍摄角度。在标注方面,行级文本的四边形边界框通过行级文本进行转录。该数据集可用于阿拉伯语国家的OCR任务。数据收集环境包括商店招牌、停车牌、海报、门票、路标、漫画、封面图片、提示/提醒、警告、包装说明、菜单、建筑标志、杂志封面等。数据格式为.jpg图像和.json标注文件。标注内容包括行级文本的四边形边界框和转录,准确性较高,边界框的误差在5像素以内,边界框和文本转录的准确性均不低于97%。
10,020个阿拉伯语自然场景OCR数据,包含多种自然场景和多个拍摄角度。在标注方面,行级文本的四边形边界框通过行级文本进行转录。该数据集可用于阿拉伯语国家的OCR任务。数据收集环境包括商店招牌、停车牌、海报、门票、路标、漫画、封面图片、提示/提醒、警告、包装说明、菜单、建筑标志、杂志封面等。数据格式为.jpg图像和.json标注文件。标注内容包括行级文本的四边形边界框和转录,准确性较高,边界框的误差在5像素以内,边界框和文本转录的准确性均不低于97%。
提供机构:
Nexdata
原始信息汇总
数据集概述
基本信息
- 数据集名称:阿拉伯语自然场景OCR数据集
- 数据量:包含10,020张图像
- 许可证:CC-BY-NC-ND-4.0
数据内容
- 收集环境:涵盖商店招牌、停车牌、海报、票据、路标、漫画、封面图片、提示/提醒、警告、包装说明、菜单、建筑标志、杂志书籍封面等。
- 数据多样性:包含多种自然场景,多个拍摄角度
- 设备:手机、相机
- 拍摄角度:仰视角度、俯视角度、平视角度
- 数据格式:图像格式为.jpg,标注文件格式为.json
标注信息
- 标注内容:行级四边形边界框标注及文本转录
- 标注精度:四边形边界框每个顶点的误差不超过5像素,边界框标注准确率不低于97%;文本转录准确率不低于97%
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个包含10,020张阿拉伯语自然场景图像的OCR数据集,涵盖商店招牌、路标、海报等多种场景,采用行级文本四边形边界框标注和转写。数据集适用于阿拉伯语OCR任务,标注精度高,但当前提供的是付费数据集的样本。
以上内容由遇见数据集搜集并总结生成



