VTC
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/VTC
下载链接
链接失效反馈官方服务:
资源简介:
VTC是一个大规模的多模态数据集,其中包含视频字幕对以及可用于多模态表示学习的注释。
此数据集是我们收集的原始数据集的较大、未筛选版本的示例。从最初的版本中,我们精心挑选了一个“安全”子版块列表,并在以下情况下删除了帖子:1)它们有“NSFW”或“超过18”标签;2) 视频包含面孔或字幕包含有毒或令人反感的文字。
我们只公开发布网址,以便如果用户决定删除帖子,则指向该帖子的链接将变为无效。此数据集不应用于可能泄露用户身份或直接或间接损害用户的任务。
提供机构:
OpenDataLab
创建时间:
2022-11-18
搜集汇总
数据集介绍

背景与挑战
背景概述
VTC是一个大规模多模态数据集,包含视频字幕对及注释,用于多模态表示学习。数据经过筛选,移除了不安全或冒犯性内容,仅公开发布网址以保护用户隐私,由牛津大学、阿姆斯特丹大学和Unitary Ltd.于2022年发布。
以上内容由遇见数据集搜集并总结生成



