VideoNavQA
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/VideoNavQA
下载链接
链接失效反馈官方服务:
资源简介:
VideoNavQA 数据集包含在 House3D 环境中生成的成对问题和视频。该数据集的目标是从近乎理想的导航路径评估问答性能,同时考虑比当前的具体问答 (EQA) 任务实例更完整的问题。
VideoNavQA 包含大约 101,000 对视频和问题,属于 8 个类别的 28 类问题,有 70 个可能的答案。每个问题类型是
与一个模板相关联,该模板有助于使用从视频中提取的地面实况信息进行程序化生成。数据集中问题的复杂性远远超过使用该生成方法的其他类似任务(如 CLEVR):问题涉及单个或多个对象/房间存在、对象/房间计数、对象颜色识别和定位、空间推理,对象/房间大小比较和对象属性(颜色,房间位置)的相等性。
提供机构:
OpenDataLab
创建时间:
2022-06-07



