Nexdata/20011_Image_Caption_Data_Of_OCR_In_Natural_Scenes

Name: Nexdata/20011_Image_Caption_Data_Of_OCR_In_Natural_Scenes
Creator: Nexdata
Published: 2024-04-16 01:41:36
License: 暂无描述

Hugging Face2024-04-16 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Nexdata/20011_Image_Caption_Data_Of_OCR_In_Natural_Scenes

下载链接

链接失效反馈

官方服务：

资源简介：

20,000张自然场景中的OCR图像描述数据，包括亚洲和欧洲语言，共14种语言，收集环境包括商店招牌、停车标志、海报、路标等场景，包含多种拍摄角度。描述语言为英语，主要描述文本排列、文本内容、颜色等信息。

提供机构：

Nexdata

原始信息汇总

数据集概述

规模: 包含20,000张图片及对应的20,000条描述。
语言分布:
- 亚洲语言: 韩语、印尼语、马来语、越南语、泰语、中文、日语。
- 欧洲语言: 法语、德语、意大利语、葡萄牙语、俄语、西班牙语、英语。
收集环境: 包括商店招牌、停车标志、海报、路标等多种场景。
收集多样性: 涵盖14种语言，多种自然场景及多个拍摄角度。
数据格式:
- 图片格式: .jpg
- 文本格式: .txt
收集设备: 手机、相机。
描述语言: 英语。
文本长度: 原则上30~60字，通常为3-5句。
主要描述内容: 文本排列、文本内容、颜色、场景。
准确率: 正确标注的图片比例不低于97%。

5,000+

优质数据集

54 个

任务类型

进入经典数据集