five

How2 多语言视频数据集

收藏
超神经2022-10-25 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/18314
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于多语言视频数据集,包含 13,500 个视频,300 小时演讲,视频均带有英文字幕和的葡萄牙语翻译。其中 185,187 个语料用于训练、 2,022 个语料用于开发(dev)、 2,361 个语料用于测试。该数据集可用于研究多模态语言理解。

This is a multilingual video dataset containing 13,500 videos and 300 hours of speeches. All videos are equipped with English subtitles and Portuguese translations. Specifically, 185,187 corpus samples are allocated for training, 2,022 for development (dev), and 2,361 for testing. This dataset can be used for research on multimodal language understanding.
创建时间:
2022-10-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
How2 多语言视频数据集包含13,500个视频,总计300小时演讲内容,每个视频均配有英文字幕和葡萄牙语翻译。该数据集划分了185,187个训练语料、2,022个开发集和2,361个测试集,适用于多模态语言理解研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务