five

Nexdata/71535_Images_English_OCR_Data_in_Natural_Scenes

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/71535_Images_English_OCR_Data_in_Natural_Scenes
下载链接
链接失效反馈
官方服务:
资源简介:
71,535张自然场景中的英文OCR数据。该数据集的收集场景为英国和美国的真实场景,数据多样性包括多种场景、多种拍摄角度和多种光照条件。注释采用行级、词级和字符级的矩形或四边形边界框注释,并包含文本转录。该数据集可用于自然场景中的英文OCR任务。

71,535张自然场景中的英文OCR数据。该数据集的收集场景为英国和美国的真实场景,数据多样性包括多种场景、多种拍摄角度和多种光照条件。注释采用行级、词级和字符级的矩形或四边形边界框注释,并包含文本转录。该数据集可用于自然场景中的英文OCR任务。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集描述

  • 数据集名称:71,535 Images English OCR Data in Natural Scenes
  • 场景来源:英国和美国的真实场景
  • 数据多样性:包含多种场景、多个摄影角度和多种光照条件
  • 标注方式:采用线级、词级和字符级的矩形或四边形边界框标注,以及文本转录
  • 应用领域:适用于自然场景下的英文OCR任务

数据集详情

  • 数据大小:71,535张图片,每张图片包含1-200个单词
  • 采集环境:现场采集于英国和美国,包括商店招牌、海报、路标、提示、警告、包装说明、菜单、建筑标志等
  • 采集设备:手机、相机、平板电脑
  • 摄影角度:仰视角度、俯视角度、平视角度
  • 数据格式:图片格式为.jpg,标注文件格式为.json
  • 标注内容:线级、词级和字符级的矩形或四边形边界框标注;文本转录
  • 准确性:边界框标注准确率不低于95%;文本转录准确率不低于95%

许可证信息

  • 许可证:商业许可证
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作