IIIT_5K
收藏魔搭社区2025-10-18 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/IIIT_5K
下载链接
链接失效反馈官方服务:
资源简介:
displayName: IIIT 5K
labelTypes:
- Text
license:
- IIIT 5K Custom
mediaTypes:
- Image
paperUrl: http://cdn.iiit.ac.in/cdn/cvit.iiit.ac.in/projects/SceneTextUnderstanding/Home/mishraBMVC12.pdf
publishDate: "2012"
publishUrl: http://cvit.iiit.ac.in/projects/SceneTextUnderstanding/IIIT5K.html
publisher:
- International Institute for Information Technology, Hyderabad
tags:
- Word image
taskTypes:
- OCR
---
# 数据集介绍
## 简介
IIIT 5k字数据集是从Google图片搜索中收获的。使用广告牌,招牌,门牌号,门牌,电影海报等查询词来收集图像。该数据集包含来自场景文本和born-digital图像的5000裁剪单词图像。数据集分为火车和测试部分。此数据集可用于大型词典裁剪单词识别。我们还通过此数据集提供了50万多个词典单词的词典。
## Download dataset
:modelscope-code[]{type="git"}
displayName: IIIT 5K
labelTypes:
- 文本
license:
- IIIT 5K 自定义许可
mediaTypes:
- 图像
paperUrl: http://cdn.iiit.ac.in/cdn/cvit.iiit.ac.in/projects/SceneTextUnderstanding/Home/mishraBMVC12.pdf
publishDate: "2012"
publishUrl: http://cvit.iiit.ac.in/projects/SceneTextUnderstanding/IIIT5K.html
publisher:
- 印度海得拉巴国际信息技术学院(International Institute for Information Technology, Hyderabad)
tags:
- 单词图像(Word image)
taskTypes:
- 光学字符识别(OCR)
---
# 数据集简介
## 简介
IIIT 5K单词图像数据集采集自谷歌图片搜索,以广告牌、招牌、门牌号、门牌、电影海报等作为检索关键词完成图像采集。该数据集包含5000张裁剪后的单词图像,素材涵盖场景文本与原生数字图像(born-digital image)。数据集划分为训练集与测试集,可用于面向大规模词典的裁剪单词识别任务。此外,本数据集还附带包含50余万个词典词汇的词典资源。
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02



