MSR-VTT
收藏魔搭社区2025-11-19 更新2025-03-01 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/MSR-VTT
下载链接
链接失效反馈官方服务:
资源简介:
displayName: MSR-VTT
license:
- Unknown
mediaTypes:
- Text
paperUrl: http://openaccess.thecvf.com/content_cvpr_2016/papers/Xu_MSR-VTT_A_Large_CVPR_2016_paper.pdf
publishDate: 2016-06
publishUrl: https://www.microsoft.com/en-us/research/publication/msr-vtt-a-large-video-description-dataset-for-bridging-video-and-language/
publisher:
- Microsoft Research
tags:
- Video
taskTypes:
- Visual Question Answering
- Video Retrieval
- Video Question Answering
---
# 数据集介绍
## 简介
MSR-VTT(Microsoft Research Video to Text)是一个用于开放域视频字幕的大规模数据集,由 20 个类别的 10,000 个视频片段组成,每个视频片段由 Amazon Mechanical Turks 用 20 个英文句子进行注释。所有字幕中大约有 29,000 个独特的单词。标准拆分使用 6,513 个剪辑用于训练,497 个剪辑用于验证,2,990 个剪辑用于测试。
## 引文
```
@inproceedings{xu2016msr,
title={Msr-vtt: A large video description dataset for bridging video and language},
author={Xu, Jun and Mei, Tao and Yao, Ting and Rui, Yong},
booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
pages={5288--5296},
year={2016}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: MSR-VTT
license:
- 未知
mediaTypes:
- 文本
paperUrl: http://openaccess.thecvf.com/content_cvpr_2016/papers/Xu_MSR-VTT_A_Large_CVPR_2016_paper.pdf
publishDate: 2016年6月
publishUrl: https://www.microsoft.com/en-us/research/publication/msr-vtt-a-large-video-description-dataset-for-bridging-video-and-language/
publisher:
- 微软研究院(Microsoft Research)
tags:
- 视频(Video)
taskTypes:
- 视觉问答(Visual Question Answering)
- 视频检索(Video Retrieval)
- 视频问答(Video Question Answering)
---
# 数据集介绍
## 简介
MSR-VTT(全称Microsoft Research Video to Text,微软研究院视频转文本)是一款面向开放域视频字幕生成的大规模数据集,共包含20个类别下的10000个视频片段,每个片段均由亚马逊(Amazon)机械Turk(Mechanical Turk)平台的标注人员使用20条英文语句进行标注。全部标注语句共包含约29000个独特词汇。该数据集采用标准划分方案:6513个片段用于训练集,497个片段用于验证集,2990个片段用于测试集。
## 引文
@inproceedings{xu2016msr,
title={Msr-vtt: A large video description dataset for bridging video and language},
author={Xu, Jun and Mei, Tao and Yao, Ting and Rui, Yong},
booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
pages={5288--5296},
year={2016}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-05



