five

TVC (TV show Captions)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/TVC
下载链接
链接失效反馈
官方服务:
资源简介:
电视节目 Caption 是一个大规模的多模态字幕数据集,包含 261,490 个字幕描述和 108,965 个短视频片段。 TVC 是独一无二的,因为它的字幕也可以描述对话/字幕,而其他数据集中的字幕仅描述视觉内容。

The TV Program Caption (TVC) is a large-scale multimodal caption dataset that comprises 261,490 caption descriptions and 108,965 short video clips. TVC is unique in that its captions can also describe dialogues or on-screen subtitles, while captions in other datasets only describe visual content.
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
TVC是一个2020年发布的大规模多模态字幕数据集,由北卡罗来纳大学教堂山分校创建,包含约26.1万条字幕描述和10.9万个短视频片段。其独特之处在于字幕不仅描述视觉内容,还涵盖对话和文本信息。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作