five

高精度的视听觉融合感知识别算法实验数据集

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6858174e195d264c3e822042&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集主要面向智能机器人在复杂环境下的感知识别需求建设,致力于提升其在多源信息干扰背景下的目标识别准确性与鲁棒性,使机器人能够同时整合并处理目标的声音和视觉信息,从而在不同环境和场景下精准识别目标,本数据集基于ImageNet21K视觉数据集及标准构建,并采集网络上公开的音视频数据,通过图像与音频的匹配实现,最终构建了视听双模态目标识别数据集。数据集主要包括室内外场景下多类别目标的图片、音频流及标注信息。
提供机构:
中国科学院上海微系统与信息技术研究所
二维码
社区交流群
二维码
科研交流群
商业服务