Nexdata/71535_Images_English_OCR_Data_in_Natural_Scenes
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/71535_Images_English_OCR_Data_in_Natural_Scenes
下载链接
链接失效反馈官方服务:
资源简介:
71,535张自然场景中的英文OCR数据。该数据集的收集场景为英国和美国的真实场景,数据多样性包括多种场景、多种拍摄角度和多种光照条件。注释采用行级、词级和字符级的矩形或四边形边界框注释,并包含文本转录。该数据集可用于自然场景中的英文OCR任务。
71,535张自然场景中的英文OCR数据。该数据集的收集场景为英国和美国的真实场景,数据多样性包括多种场景、多种拍摄角度和多种光照条件。注释采用行级、词级和字符级的矩形或四边形边界框注释,并包含文本转录。该数据集可用于自然场景中的英文OCR任务。
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集描述
- 数据集名称:71,535 Images English OCR Data in Natural Scenes
- 场景来源:英国和美国的真实场景
- 数据多样性:包含多种场景、多个摄影角度和多种光照条件
- 标注方式:采用线级、词级和字符级的矩形或四边形边界框标注,以及文本转录
- 应用领域:适用于自然场景下的英文OCR任务
数据集详情
- 数据大小:71,535张图片,每张图片包含1-200个单词
- 采集环境:现场采集于英国和美国,包括商店招牌、海报、路标、提示、警告、包装说明、菜单、建筑标志等
- 采集设备:手机、相机、平板电脑
- 摄影角度:仰视角度、俯视角度、平视角度
- 数据格式:图片格式为.jpg,标注文件格式为.json
- 标注内容:线级、词级和字符级的矩形或四边形边界框标注;文本转录
- 准确性:边界框标注准确率不低于95%;文本转录准确率不低于95%
许可证信息
- 许可证:商业许可证



