TVQA+
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/TVQA_plus
下载链接
链接失效反馈官方服务:
资源简介:
我们提出了时空视频问答的任务,这需要智能系统同时检索相关时刻并检测引用的视觉概念(人和物体)来回答有关视频的自然语言问题。我们首先使用 310.8k 边界框来扩充 TVQA 数据集,将描绘的对象与问题和答案中的视觉概念联系起来。我们将此增强版本命名为 TVQA+。然后,我们提出了基于证据的时空回答器(STAGE),这是一个统一的框架,可以在空间和时间域中建立证据来回答有关视频的问题。综合实验和分析证明了我们框架的有效性以及我们 TVQA+ 数据集中的丰富注释如何有助于问答任务。作为一个副产品,通过执行这个联合任务,我们的模型能够产生更有洞察力的中间结果。
提供机构:
OpenDataLab
创建时间:
2022-08-10
搜集汇总
数据集介绍

背景与挑战
背景概述
TVQA+是一个增强的时空视频问答数据集,在TVQA基础上扩充了31.08万个边界框注释,以关联视觉概念与问题答案。该数据集由北卡罗来纳大学教堂山分校于2019年发布,旨在支持智能系统通过检索时刻和检测视觉对象来回答视频相关问题。
以上内容由遇见数据集搜集并总结生成



