Violin 视频和语言推理数据集

超神经2022-09-09 更新2024-05-15 收录

下载链接：

https://hyper.ai/cn/datasets/19715

下载链接

链接失效反馈

官方服务：

资源简介：

Violin 全称 VIdeO-and-Language INference，可用于对视频和文本进行多模态理解的任务。

Violin, whose full name is VIdeO-and-Language INference, is a dataset for multimodal understanding tasks involving videos and text.

创建时间：

2022-09-09

搜集汇总

数据集介绍

背景与挑战

背景概述

Violin（VIdeO-and-Language INference）是一个多模态视频和语言推理数据集，包含来自15,887个视频剪辑的95,322个视频-假设对，总时长超过582小时，涵盖丰富的时间动态和人际互动内容。数据来源于流行电视节目和YouTube电影剪辑，由社区贡献，主要用于教育和信息目的。

以上内容由遇见数据集搜集并总结生成