five

Nexdata/3506_Hindi_OCR_Images_Data_Images_with_Annotation_and_Transcription

收藏
Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/3506_Hindi_OCR_Images_Data_Images_with_Annotation_and_Transcription
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含3,506张印地语OCR图像,其中2,056张为自然场景图像,1,103张为互联网图像,347张为文档图像。注释采用行级和列级的四边形边界框注释及文本转录。数据可用于多种场景下的印地语字符识别任务。

该数据集包含3,506张印地语OCR图像,其中2,056张为自然场景图像,1,103张为互联网图像,347张为文档图像。注释采用行级和列级的四边形边界框注释及文本转录。数据可用于多种场景下的印地语字符识别任务。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集描述

  • 名称: 3,506 Hindi OCR Images Data
  • 内容: 包含3,506张图像,分为三类:2,056张自然场景图像,1,103张互联网图像,347张文档图像。
  • 用途: 适用于多种场景下的印地语字符识别任务。
  • 注释方式:
    • 行级内容:采用行级四边形边界框注释和文本转录。
    • 列级内容:采用列级四边形边界框注释和文本转录。

数据大小

  • 总计3,506张OCR图像。

收集环境

  • 自然场景:包括牌匾、包装说明、小广告、菜单、海报等。
  • 互联网图像:包括杂志封面、漫画封面等。
  • 文档图像:包括文本文档等。

数据多样性

  • 包含多种场景、多个角度和不同光照条件。

设备

  • 使用手机拍摄。

拍摄角度

  • 仰视角度、平视角度。

格式

  • 图像数据格式:.jpg
  • 注释文件格式:.json

注释内容

  • 行级四边形边界框注释和文本转录。
  • 列级四边形边界框注释和文本转录。

准确性

  • 边界框每个顶点的误差范围在10像素内,边界框准确率不低于97%。
  • 文本转录准确率不低于97%。

许可证信息

  • 商业许可证
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作