five

IIIT_5K

收藏
魔搭社区2025-10-18 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/IIIT_5K
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: IIIT 5K labelTypes: - Text license: - IIIT 5K Custom mediaTypes: - Image paperUrl: http://cdn.iiit.ac.in/cdn/cvit.iiit.ac.in/projects/SceneTextUnderstanding/Home/mishraBMVC12.pdf publishDate: "2012" publishUrl: http://cvit.iiit.ac.in/projects/SceneTextUnderstanding/IIIT5K.html publisher: - International Institute for Information Technology, Hyderabad tags: - Word image taskTypes: - OCR --- # 数据集介绍 ## 简介 IIIT 5k字数据集是从Google图片搜索中收获的。使用广告牌,招牌,门牌号,门牌,电影海报等查询词来收集图像。该数据集包含来自场景文本和born-digital图像的5000裁剪单词图像。数据集分为火车和测试部分。此数据集可用于大型词典裁剪单词识别。我们还通过此数据集提供了50万多个词典单词的词典。 ## Download dataset :modelscope-code[]{type="git"}

displayName: IIIT 5K labelTypes: - 文本 license: - IIIT 5K 自定义许可 mediaTypes: - 图像 paperUrl: http://cdn.iiit.ac.in/cdn/cvit.iiit.ac.in/projects/SceneTextUnderstanding/Home/mishraBMVC12.pdf publishDate: "2012" publishUrl: http://cvit.iiit.ac.in/projects/SceneTextUnderstanding/IIIT5K.html publisher: - 印度海得拉巴国际信息技术学院(International Institute for Information Technology, Hyderabad) tags: - 单词图像(Word image) taskTypes: - 光学字符识别(OCR) --- # 数据集简介 ## 简介 IIIT 5K单词图像数据集采集自谷歌图片搜索,以广告牌、招牌、门牌号、门牌、电影海报等作为检索关键词完成图像采集。该数据集包含5000张裁剪后的单词图像,素材涵盖场景文本与原生数字图像(born-digital image)。数据集划分为训练集与测试集,可用于面向大规模词典的裁剪单词识别任务。此外,本数据集还附带包含50余万个词典词汇的词典资源。 ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作