VideoNavQA
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/VideoNavQA
下载链接
链接失效反馈官方服务:
资源简介:
VideoNavQA 数据集包含在 House3D 环境中生成的成对问题和视频。该数据集的目标是从近乎理想的导航路径评估问答性能,同时考虑比当前的具体问答 (EQA) 任务实例更完整的问题。
VideoNavQA 包含大约 101,000 对视频和问题,属于 8 个类别的 28 类问题,有 70 个可能的答案。每个问题类型是
与一个模板相关联,该模板有助于使用从视频中提取的地面实况信息进行程序化生成。数据集中问题的复杂性远远超过使用该生成方法的其他类似任务(如 CLEVR):问题涉及单个或多个对象/房间存在、对象/房间计数、对象颜色识别和定位、空间推理,对象/房间大小比较和对象属性(颜色,房间位置)的相等性。
提供机构:
OpenDataLab
创建时间:
2022-06-07
搜集汇总
数据集介绍

背景与挑战
背景概述
VideoNavQA数据集包含约10.1万对视频和问题,用于在House3D环境中评估问答性能。它涵盖8个类别的28类问题,涉及对象/房间存在、计数、颜色识别、空间推理等多种复杂任务,通过程序化生成方法创建。
以上内容由遇见数据集搜集并总结生成



