CRIPP-VQA
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/CRIPP-VQA
下载链接
链接失效反馈官方服务:
资源简介:
视频通常会捕获对象,它们的运动以及不同对象之间的交互。尽管现实世界的物体具有与之相关联的物理属性,但其中许多属性 (例如质量和摩擦系数) 并未直接由成像管道捕获。但是,可以通过利用相对物体运动和碰撞引入的动力学的提示来估计这些属性。在本文中,我们介绍了一种新的视频问答任务,用于从视频中推理场景中对象的隐式物理属性。对于此任务,我们介绍了一个dataset-CRIPP-VQA,其中包含运动中的对象的视频,并带有有关操作效果 (例如删除,添加或替换对象) 的假设/反事实问题,有关计划的问题 (为达到特定目标而选择要执行的操作),以及有关对象可见属性的描述性问题。我们在cripp-vqa的两个测试设置上对现有视频问答模型的性能进行基准测试: i.d.以及不分布设置,其中包含质量,摩擦系数和初始速度值的对象,这些对象在训练分布中看不到。在回答有关对象的隐式属性 (本文的重点) 和显式属性 (先前工作的重点) 的问题方面,我们的实验揭示了令人惊讶的显着性能差距。
提供机构:
OpenDataLab
创建时间:
2022-11-18
搜集汇总
数据集介绍

背景与挑战
背景概述
CRIPP-VQA是一个视频问答数据集,旨在从视频中推理对象的隐式物理属性,如质量和摩擦系数。该数据集由亚利桑那州立大学于2022年发布,包含假设性、计划性和描述性问题,用于评估模型在分布内和分布外设置下的性能,并揭示了模型在隐式与显式属性问题上的显著差距。
以上内容由遇见数据集搜集并总结生成



