MSR-VTT

Name: MSR-VTT
Creator: maas
Published: 2025-11-19 12:33:56
License: 暂无描述

魔搭社区2025-11-19 更新2025-03-01 收录

下载链接：

https://modelscope.cn/datasets/OpenDataLab/MSR-VTT

下载链接

链接失效反馈

官方服务：

资源简介：

displayName: MSR-VTT license: - Unknown mediaTypes: - Text paperUrl: http://openaccess.thecvf.com/content_cvpr_2016/papers/Xu_MSR-VTT_A_Large_CVPR_2016_paper.pdf publishDate: 2016-06 publishUrl: https://www.microsoft.com/en-us/research/publication/msr-vtt-a-large-video-description-dataset-for-bridging-video-and-language/ publisher: - Microsoft Research tags: - Video taskTypes: - Visual Question Answering - Video Retrieval - Video Question Answering --- # 数据集介绍 ## 简介 MSR-VTT（Microsoft Research Video to Text）是一个用于开放域视频字幕的大规模数据集，由 20 个类别的 10,000 个视频片段组成，每个视频片段由 Amazon Mechanical Turks 用 20 个英文句子进行注释。所有字幕中大约有 29,000 个独特的单词。标准拆分使用 6,513 个剪辑用于训练，497 个剪辑用于验证，2,990 个剪辑用于测试。 ## 引文 ``` @inproceedings{xu2016msr, title={Msr-vtt: A large video description dataset for bridging video and language}, author={Xu, Jun and Mei, Tao and Yao, Ting and Rui, Yong}, booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition}, pages={5288--5296}, year={2016} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: MSR-VTT license: - 未知 mediaTypes: - 文本 paperUrl: http://openaccess.thecvf.com/content_cvpr_2016/papers/Xu_MSR-VTT_A_Large_CVPR_2016_paper.pdf publishDate: 2016年6月 publishUrl: https://www.microsoft.com/en-us/research/publication/msr-vtt-a-large-video-description-dataset-for-bridging-video-and-language/ publisher: - 微软研究院（Microsoft Research） tags: - 视频（Video） taskTypes: - 视觉问答（Visual Question Answering） - 视频检索（Video Retrieval） - 视频问答（Video Question Answering） --- # 数据集介绍 ## 简介 MSR-VTT（全称Microsoft Research Video to Text，微软研究院视频转文本）是一款面向开放域视频字幕生成的大规模数据集，共包含20个类别下的10000个视频片段，每个片段均由亚马逊（Amazon）机械Turk（Mechanical Turk）平台的标注人员使用20条英文语句进行标注。全部标注语句共包含约29000个独特词汇。该数据集采用标准划分方案：6513个片段用于训练集，497个片段用于验证集，2990个片段用于测试集。 ## 引文 @inproceedings{xu2016msr, title={Msr-vtt: A large video description dataset for bridging video and language}, author={Xu, Jun and Mei, Tao and Yao, Ting and Rui, Yong}, booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition}, pages={5288--5296}, year={2016} } ## 数据集下载 :modelscope-code[]{type="git"}

提供机构：

maas

创建时间：

2024-07-05

5,000+

优质数据集

54 个

任务类型

进入经典数据集