five

InternVid

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shepshep/InternVid
下载链接
链接失效反馈
官方服务:
资源简介:
InternVid是一个大规模的以视频为中心的多模态数据集,可用于学习强大且可迁移的视频-文本表示,用于多模态理解和生成。
提供机构:
shepshep
创建时间:
2023-10-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
InternVid是一个大规模视频-文本多模态数据集,包含超过700万个视频和2.34亿个片段,总时长近76万小时,用于学习视频-文本表示以支持多模态理解和生成。其核心贡献在于开发了一种基于语言模型的可扩展方法,用于构建高质量视频-文本数据,并引入了ViCLIP模型,在零样本动作识别和视频检索中表现领先。当前发布提供了子集InternVid-10M-FLT,包含1000万个视频片段,附带详细描述、美学评分和相关性分数。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作