five

Vript 英文视频-文本数据集

收藏
超神经2024-07-17 更新2024-07-06 收录
下载链接:
https://hyper.ai/cn/datasets/32709
下载链接
链接失效反馈
官方服务:
资源简介:
Vript 是一个具有高分辨率视频的细粒度视频文本数据集,它包含 12k 个经过注释的视频,总共超过 420k 个剪辑片段。 Vript 数据集的每个片段都配有大约 145 个单词的标题,这比大多数视频文本数据集的注释要长得多,提供了更为详细和密集的描述。这个数据集的注释灵感来源于视频脚本,类似于在制作视频前编写的脚本来组织如何拍摄场景。

Vript is a fine-grained video-text dataset with high-resolution videos. It contains 12k annotated videos, totaling over 420k clipped segments. Each segment in the Vript dataset is paired with a caption of approximately 145 words, which is significantly longer than annotations from most existing video-text datasets, providing more detailed and dense descriptions. The annotations of this dataset are inspired by video scripts, similar to the shooting scripts written prior to video production to organize how to shoot scenes.
创建时间:
2024-07-03
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Vript是一个多模态视频文本数据集,包含12k个高分辨率视频和超过420k个剪辑片段,每个片段配有约145个单词的细粒度标题,并记录镜头类型和摄像机运动。该数据集由上海交通大学、北京航空航天大学和小红书团队于2024年发布,旨在提供更丰富的视频描述和背景信息。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务