five

基于COCO随机图像的外部知识引导视觉问答数据集

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=674b68d9195d2661e1ba4117&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
大规模的需要外部知识的视觉问答数据集数据集-OK-VQA(Outside Knowledge VQA)。使用来自COCO的随机图像,80k训练。一共14055个问题,12591个不重复问题,7181个不重复的问题单词。一共6个文件,其中word文件是数据对应指标的实现方案。5个压缩文件中,一个是COCO数据集中图片的压缩文件,另外2个是训练的图像编号问题字典json文件以及问题标签json文件,剩下2个是验证的图像编号问题字典json文件以及问题标签json文件。图像编号问题字典json文件包括了一个字典结构,其中Key是图像在对应COCO数据集中的编号,Value是对应问题的文本。问题标签json文件包括了一个字典结构,提供了问题的答案信息。
提供机构:
海南大学
二维码
社区交流群
二维码
科研交流群
商业服务