five

Nexdata/10020_Images_of_Arabic_Natural_Scene_OCR_Data

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/10020_Images_of_Arabic_Natural_Scene_OCR_Data
下载链接
链接失效反馈
官方服务:
资源简介:
10,020个阿拉伯语自然场景OCR数据,包含多种自然场景和多个拍摄角度。在标注方面,行级文本的四边形边界框通过行级文本进行转录。该数据集可用于阿拉伯语国家的OCR任务。数据收集环境包括商店招牌、停车牌、海报、门票、路标、漫画、封面图片、提示/提醒、警告、包装说明、菜单、建筑标志、杂志封面等。数据格式为.jpg图像和.json标注文件。标注内容包括行级文本的四边形边界框和转录,准确性较高,边界框的误差在5像素以内,边界框和文本转录的准确性均不低于97%。

10,020个阿拉伯语自然场景OCR数据,包含多种自然场景和多个拍摄角度。在标注方面,行级文本的四边形边界框通过行级文本进行转录。该数据集可用于阿拉伯语国家的OCR任务。数据收集环境包括商店招牌、停车牌、海报、门票、路标、漫画、封面图片、提示/提醒、警告、包装说明、菜单、建筑标志、杂志封面等。数据格式为.jpg图像和.json标注文件。标注内容包括行级文本的四边形边界框和转录,准确性较高,边界框的误差在5像素以内,边界框和文本转录的准确性均不低于97%。
提供机构:
Nexdata
原始信息汇总

数据集概述

基本信息

  • 数据集名称:阿拉伯语自然场景OCR数据集
  • 数据量:包含10,020张图像
  • 许可证:CC-BY-NC-ND-4.0

数据内容

  • 收集环境:涵盖商店招牌、停车牌、海报、票据、路标、漫画、封面图片、提示/提醒、警告、包装说明、菜单、建筑标志、杂志书籍封面等。
  • 数据多样性:包含多种自然场景,多个拍摄角度
  • 设备:手机、相机
  • 拍摄角度:仰视角度、俯视角度、平视角度
  • 数据格式:图像格式为.jpg,标注文件格式为.json

标注信息

  • 标注内容:行级四边形边界框标注及文本转录
  • 标注精度:四边形边界框每个顶点的误差不超过5像素,边界框标注准确率不低于97%;文本转录准确率不低于97%
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个包含10,020张阿拉伯语自然场景图像的OCR数据集,涵盖商店招牌、路标、海报等多种场景,采用行级文本四边形边界框标注和转写。数据集适用于阿拉伯语OCR任务,标注精度高,但当前提供的是付费数据集的样本。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作