five

VATEX Dataset

收藏
paperswithcode.com2025-03-26 收录
下载链接:
https://paperswithcode.com/dataset/vatex
下载链接
链接失效反馈
官方服务:
资源简介:
VATEX is multilingual, large, linguistically complex, and diverse dataset in terms of both video and natural language descriptions. It has two tasks for video-and-language research: (1) Multilingual Video Captioning, aimed at describing a video in various languages with a compact unified captioning model, and (2) Video-guided Machine Translation, to translate a source language description into the target language using the video information as additional spatiotemporal context.

VATEX 是一个多语言、大型、语言复杂且内容多样的数据集,既涉及视频又包含自然语言描述。该数据集针对视频与语言研究设定了两个任务:(1) 多语言视频字幕生成,旨在通过紧凑统一的字幕模型用多种语言描述视频,以及(2) 视频引导的机器翻译,利用视频信息作为额外的时空背景,将源语言描述翻译成目标语言。
提供机构:
Papers with Code
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作