Violin 视频和语言推理数据集
收藏超神经2022-09-09 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/19715
下载链接
链接失效反馈官方服务:
资源简介:
Violin 全称 VIdeO-and-Language INference,可用于对视频和文本进行多模态理解的任务。
Violin, whose full name is VIdeO-and-Language INference, is a dataset for multimodal understanding tasks involving videos and text.
创建时间:
2022-09-09
搜集汇总
数据集介绍

背景与挑战
背景概述
Violin(VIdeO-and-Language INference)是一个多模态视频和语言推理数据集,包含来自15,887个视频剪辑的95,322个视频-假设对,总时长超过582小时,涵盖丰富的时间动态和人际互动内容。数据来源于流行电视节目和YouTube电影剪辑,由社区贡献,主要用于教育和信息目的。
以上内容由遇见数据集搜集并总结生成



