面向通用视觉的跨模态数据
收藏国家基础学科公共科学数据中心2025-11-29 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69248114195d26651c427ba2&type=1
下载链接
链接失效反馈官方服务:
资源简介:
该跨模态数据主要面向通用视觉研究,用于暗知识库的需求进行建设。
面向通用视觉的跨模态数据,主要包含视频-文本2个模态,覆盖10个通用视觉典型应用领域,包括智慧城市、海绵城市、智能手机、科学技术、文化娱乐、体育健身、生物生态、自动驾驶、教育技能、元宇宙/3D。
视频模态来源于公开视频数据,文本模态为项目组标注的视频内容描述文本。该数据集共包含4279076视频-文本对。
提供机构:
中国科学院深圳先进技术研究院



