InternVid-Full 高质量大规模视频-文本数据集
收藏超神经2024-06-17 更新2024-06-29 收录
下载链接:
https://hyper.ai/cn/datasets/32395
下载链接
链接失效反馈官方服务:
资源简介:
该数据集为上海人工智能实验室(上海 AI 实验室)联合南京大学、中国科学院等机构于 2024 年联合发布高质量大规模视频-文本数据集,旨在应对日益扩大的视频-语言建模规模需求,推动大模型视频理解和生成能力进一步提升。
This high-quality large-scale video-text dataset was co-released in 2024 by the Shanghai AI Laboratory (Shanghai AI Lab) in collaboration with institutions including Nanjing University and the Chinese Academy of Sciences. It aims to address the growing demand for large-scale video-language modeling, and to further advance the video understanding and generation capabilities of large language models.
创建时间:
2024-06-12
搜集汇总
数据集介绍

背景与挑战
背景概述
InternVid-Full是2024年由上海人工智能实验室等机构联合发布的大规模视频-文本数据集,包含超700万条高匹配度的视频-文本对,覆盖16种场景和约6000个动作,总时长近76万小时。该数据集旨在支持视频-文本语义匹配、检索和生成等多模态学习任务,并已应用于多模态世界模型LWM等研究,在学术界受到广泛关注。
以上内容由遇见数据集搜集并总结生成



