VideoVista/VideoVista
收藏Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/VideoVista/VideoVista
下载链接
链接失效反馈官方服务:
资源简介:
VideoVista是一个视频基准测试数据集,旨在全面评估大型多模态模型(LMMs)在视频理解和推理方面的性能。该数据集包含25,000个问题,这些问题来源于3,400个视频,涵盖了14个类别(如Howto、Film和Entertainment),视频时长从几秒到超过10分钟不等。此外,数据集还包含19种理解任务(如异常检测、交互理解)和8种推理任务(如逻辑推理、因果推理)。
VideoVista是一个视频基准测试数据集,旨在全面评估大型多模态模型(LMMs)在视频理解和推理方面的性能。该数据集包含25,000个问题,这些问题来源于3,400个视频,涵盖了14个类别(如Howto、Film和Entertainment),视频时长从几秒到超过10分钟不等。此外,数据集还包含19种理解任务(如异常检测、交互理解)和8种推理任务(如逻辑推理、因果推理)。
提供机构:
VideoVista
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 问答
- 语言: 英语
- 数据集大小: 10K<n<100K
数据集详情
- 名称: VideoVista
- 视频数量: 3,400
- 问题数量: 25,000
- 视频类别: 14种(例如:Howto, Film, Entertainment等)
- 视频时长: 几秒到超过10分钟
- 理解任务类型: 19种(例如:异常检测, 交互理解)
- 推理任务类型: 8种(例如:逻辑推理, 因果推理)
数据集统计
- 图表1: 任务类型的样本计数
- 图表2: 14种视频类别的统计数据
- 图表3: 视频时长的分布(分钟)
数据集示例
- 示例图片: 展示了一个数据集示例的图像
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



