five

Visual Question Answering V2.0 一个针对图像内容进行自然语言问答的数据集

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-26425.html
下载链接
链接失效反馈
官方服务:
资源简介:
Visual Question Answering (VQA) 是一个针对图像内容进行自然语言问答数据集,其中有关图像的自然语言问题和答案需要对图像内容、自然语言和常识进行智能运用才能回答。包括 25 万张图像,每张图片 3 个自然语言描述的问题,每个问题 10 个标准答案,3 个近似答案。
提供机构:
帕依提提
二维码
社区交流群
二维码
科研交流群
商业服务