five

InternVideo2视频文本数据集

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/yinanhe/InternVideo2-Vid-Text
下载链接
链接失效反馈
官方服务:
资源简介:
这是在 InternVideo2 训练的第二阶段收集的 6100 万音频-视觉-语音标注数据,其视频来源主要来自YT-Temporal-180M.我们提供了相同的 YouTubeID 以及起始和结束帧的标记。视频涵盖了广泛的主题和场景,以确保数据的多样性和代表性。其旨在促进视频和文本理解及交互领域的研究和开发。
提供机构:
yinanhe
创建时间:
2024-07-23
二维码
社区交流群
二维码
科研交流群
商业服务