five

VRBench

收藏
arXiv2025-06-13 更新2025-11-28 收录
下载链接:
https://hf-mirror.com/datasets/OpenGVLab/VRBench
下载链接
链接失效反馈
官方服务:
资源简介:
VRBench是一个用于评估大型模型多步推理能力的长叙事视频基准数据集。它包含1010个手动筛选的叙事视频,覆盖8种语言和7个视频类别,适合推理时间关系。我们还提供高质量的分步推理标注,由人类专家进行标注和审查。每个视频包含8-10个复杂的问答对、多步推理链和细粒度的时间戳。为了充分评估模型在多步推理方面的能力,我们提出了一个多阶段评估流程,从过程和结果两个层面评估模型结果。VRBench是第一个既支持多步标注又支持评估的视频推理基准。
提供机构:
上海人工智能实验室
创建时间:
2025-06-13
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作