five

VideoVista/VideoVista

收藏
Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/VideoVista/VideoVista
下载链接
链接失效反馈
官方服务:
资源简介:
VideoVista是一个视频基准测试数据集,旨在全面评估大型多模态模型(LMMs)在视频理解和推理方面的性能。该数据集包含25,000个问题,这些问题来源于3,400个视频,涵盖了14个类别(如Howto、Film和Entertainment),视频时长从几秒到超过10分钟不等。此外,数据集还包含19种理解任务(如异常检测、交互理解)和8种推理任务(如逻辑推理、因果推理)。

VideoVista是一个视频基准测试数据集,旨在全面评估大型多模态模型(LMMs)在视频理解和推理方面的性能。该数据集包含25,000个问题,这些问题来源于3,400个视频,涵盖了14个类别(如Howto、Film和Entertainment),视频时长从几秒到超过10分钟不等。此外,数据集还包含19种理解任务(如异常检测、交互理解)和8种推理任务(如逻辑推理、因果推理)。
提供机构:
VideoVista
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 问答
  • 语言: 英语
  • 数据集大小: 10K<n<100K

数据集详情

  • 名称: VideoVista
  • 视频数量: 3,400
  • 问题数量: 25,000
  • 视频类别: 14种(例如:Howto, Film, Entertainment等)
  • 视频时长: 几秒到超过10分钟
  • 理解任务类型: 19种(例如:异常检测, 交互理解)
  • 推理任务类型: 8种(例如:逻辑推理, 因果推理)

数据集统计

  • 图表1: 任务类型的样本计数
  • 图表2: 14种视频类别的统计数据
  • 图表3: 视频时长的分布(分钟)

数据集示例

  • 示例图片: 展示了一个数据集示例的图像
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作