Nexdata/3506_Hindi_OCR_Images_Data_Images_with_Annotation_and_Transcription
收藏Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/3506_Hindi_OCR_Images_Data_Images_with_Annotation_and_Transcription
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含3,506张印地语OCR图像,其中2,056张为自然场景图像,1,103张为互联网图像,347张为文档图像。注释采用行级和列级的四边形边界框注释及文本转录。数据可用于多种场景下的印地语字符识别任务。
该数据集包含3,506张印地语OCR图像,其中2,056张为自然场景图像,1,103张为互联网图像,347张为文档图像。注释采用行级和列级的四边形边界框注释及文本转录。数据可用于多种场景下的印地语字符识别任务。
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集描述
- 名称: 3,506 Hindi OCR Images Data
- 内容: 包含3,506张图像,分为三类:2,056张自然场景图像,1,103张互联网图像,347张文档图像。
- 用途: 适用于多种场景下的印地语字符识别任务。
- 注释方式:
- 行级内容:采用行级四边形边界框注释和文本转录。
- 列级内容:采用列级四边形边界框注释和文本转录。
数据大小
- 总计3,506张OCR图像。
收集环境
- 自然场景:包括牌匾、包装说明、小广告、菜单、海报等。
- 互联网图像:包括杂志封面、漫画封面等。
- 文档图像:包括文本文档等。
数据多样性
- 包含多种场景、多个角度和不同光照条件。
设备
- 使用手机拍摄。
拍摄角度
- 仰视角度、平视角度。
格式
- 图像数据格式:.jpg
- 注释文件格式:.json
注释内容
- 行级四边形边界框注释和文本转录。
- 列级四边形边界框注释和文本转录。
准确性
- 边界框每个顶点的误差范围在10像素内,边界框准确率不低于97%。
- 文本转录准确率不低于97%。
许可证信息
- 商业许可证



