five

Nexdata/20011_Image_Caption_Data_Of_OCR_In_Natural_Scenes

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/20011_Image_Caption_Data_Of_OCR_In_Natural_Scenes
下载链接
链接失效反馈
官方服务:
资源简介:
20,000张自然场景中的OCR图像描述数据,包括亚洲和欧洲语言,共14种语言,收集环境包括商店招牌、停车标志、海报、路标等场景,包含多种拍摄角度。描述语言为英语,主要描述文本排列、文本内容、颜色等信息。

20,000张自然场景中的OCR图像描述数据,包括亚洲和欧洲语言,共14种语言,收集环境包括商店招牌、停车标志、海报、路标等场景,包含多种拍摄角度。描述语言为英语,主要描述文本排列、文本内容、颜色等信息。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集描述

  • 规模: 包含20,000张图片及对应的20,000条描述。
  • 语言分布:
    • 亚洲语言: 韩语、印尼语、马来语、越南语、泰语、中文、日语。
    • 欧洲语言: 法语、德语、意大利语、葡萄牙语、俄语、西班牙语、英语。
  • 收集环境: 包括商店招牌、停车标志、海报、路标等多种场景。
  • 收集多样性: 涵盖14种语言,多种自然场景及多个拍摄角度。
  • 数据格式:
    • 图片格式: .jpg
    • 文本格式: .txt
  • 收集设备: 手机、相机。
  • 描述语言: 英语。
  • 文本长度: 原则上30~60字,通常为3-5句。
  • 主要描述内容: 文本排列、文本内容、颜色、场景。
  • 准确率: 正确标注的图片比例不低于97%。

许可信息

  • 许可证: 商业许可证。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作