IIIT 5K word数据集，包含广告牌、招牌、门牌号、门牌、电影海报等查询词

Name: IIIT 5K word数据集，包含广告牌、招牌、门牌号、门牌、电影海报等查询词
Creator: 帕依提提
License: 暂无描述

帕依提提2024-03-04 收录

下载链接：

https://www.payititi.com/opendatasets/show-26498.html

下载链接

链接失效反馈

官方服务：

资源简介：

The IIIT 5K-word dataset is harvested from Google image search. Query words like billboards, signboard, house numbers, house name plates, movie posters were used to collect images. The dataset contains 5000 cropped word images from Scene Texts and born-digital images. The dataset is divided into train and test parts. This dataset can be used for large lexicon cropped word recognition. We also provide a lexicon of more than 0.5 million dictionary words with this dataset. If you use this dataset, please cite: For any queries about the dataset feel free to contact Anand Mishra. Email:1stName.LastName@research.iiit.ac.in

IIIT 5K单词数据集（IIIT 5K-word dataset）源自谷歌图像搜索（Google image search）。研究人员以广告牌、招牌、门牌号、住宅名牌、电影海报等作为检索词采集相关图像。本数据集包含5000张来自场景文本（Scene Texts）与数字原生图像（born-digital images）的裁剪单词图像。该数据集划分为训练集与测试集两部分，可用于大词汇表裁剪单词识别（large lexicon cropped word recognition）任务。我们还随本数据集附带了包含超过50万个词典词汇的词表。若您使用本数据集，请引用：有关本数据集的任何疑问，欢迎联系Anand Mishra，电子邮箱：1stName.LastName@research.iiit.ac.in

提供机构：

帕依提提

搜集汇总

数据集介绍

背景与挑战

背景概述

IIIT 5K-word数据集包含5000张从广告牌、门牌等场景裁剪的单词图像，附带50万词的词典库，专为大型词典单词识别任务设计。数据集已划分为训练集和测试集，适用于场景文本识别研究。

以上内容由遇见数据集搜集并总结生成