Nexdata/20011_Image_Caption_Data_Of_OCR_In_Natural_Scenes
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/20011_Image_Caption_Data_Of_OCR_In_Natural_Scenes
下载链接
链接失效反馈官方服务:
资源简介:
20,000张自然场景中的OCR图像描述数据,包括亚洲和欧洲语言,共14种语言,收集环境包括商店招牌、停车标志、海报、路标等场景,包含多种拍摄角度。描述语言为英语,主要描述文本排列、文本内容、颜色等信息。
20,000张自然场景中的OCR图像描述数据,包括亚洲和欧洲语言,共14种语言,收集环境包括商店招牌、停车标志、海报、路标等场景,包含多种拍摄角度。描述语言为英语,主要描述文本排列、文本内容、颜色等信息。
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集描述
- 规模: 包含20,000张图片及对应的20,000条描述。
- 语言分布:
- 亚洲语言: 韩语、印尼语、马来语、越南语、泰语、中文、日语。
- 欧洲语言: 法语、德语、意大利语、葡萄牙语、俄语、西班牙语、英语。
- 收集环境: 包括商店招牌、停车标志、海报、路标等多种场景。
- 收集多样性: 涵盖14种语言,多种自然场景及多个拍摄角度。
- 数据格式:
- 图片格式: .jpg
- 文本格式: .txt
- 收集设备: 手机、相机。
- 描述语言: 英语。
- 文本长度: 原则上30~60字,通常为3-5句。
- 主要描述内容: 文本排列、文本内容、颜色、场景。
- 准确率: 正确标注的图片比例不低于97%。
许可信息
- 许可证: 商业许可证。



