跨模态多语言智能检索平台
收藏河南省数据产权登记服务平台2026-04-11 收录
下载链接:
https://www.darp.com.cn/portal/assetsCatalog/1791132746475442186?rightHolder=91310114697270325A&assetType=1
下载链接
链接失效反馈官方服务:
资源简介:
一款集图片检索、视频检索和跨模态检索为一体的信息检索智能软件,基于CV、OCR 等人工智能技术,对图片、音视频中的场景、字幕、弹幕、背景、商标等元素进行识别,并使用跨模态对比学习、多模态语义融合等跨模态技术,实现对文本、图片、音频、视频的跨模态信息检索、分析与应用
提供机构:
上海蜜度科技股份有限公司
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个支持图片、视频及跨模态检索的智能平台,运用CV、OCR等技术识别多媒体内容中的多种元素,并通过跨模态对比学习实现文本、图片、音频和视频的检索与分析。
以上内容由遇见数据集搜集并总结生成



