five

VQA-E 视觉问答解析数据集

收藏
超神经2022-10-28 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/20183
下载链接
链接失效反馈
官方服务:
资源简介:
VQA-E 全称 Visual Question Answering with Explanation,是带有解析的视觉问答数据集,其涉及的模型需要预测并生成答案解析。它是由 VQA v2 数据集自动衍生出来的,为每个 “图像-问题-答案三要素” 合成为一个文本解析,这使得问答过程更容易理解和可追溯。

VQA-E, short for Visual Question Answering with Explanation, is a visual question answering dataset paired with analytical explanations. Models designed for this dataset must predict answers and generate corresponding explanatory analyses. It is automatically derived from the VQA v2 dataset, where a textual explanation is synthesized for each image-question-answer triplet, thus rendering the question answering process more comprehensible and traceable.
创建时间:
2022-10-26
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
VQA-E是一个视觉问答解析数据集,基于VQA v2自动衍生,为每个图像-问题-答案组合提供文本解析,以增强问答过程的可理解性和可追溯性。该数据集包含训练和验证集,标签涉及文本生成、视觉问答和图像理解等多模态表征领域。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务