SpeakingFaces
收藏arXiv2021-05-01 更新2024-06-21 收录
下载链接:
https://doi.org/10.48333/smgd-yj77
下载链接
链接失效反馈官方服务:
资源简介:
SpeakingFaces是由智能系统与人工智能研究所创建的大型多模态数据集,包含142名参与者的同步热成像、视觉和音频数据,总计约3.8TB。数据集通过高分辨率的热成像和视觉图像流与每个参与者的音频记录同步,用于支持机器学习研究,特别是在人机交互、生物识别认证和识别系统等领域。数据集的创建过程涉及从多个角度记录参与者,并使用公开可用的命令集进行语音指令的录制。SpeakingFaces数据集的应用领域广泛,旨在解决多模态数据处理和分析中的挑战,特别是在非理想物理环境中的人机交互和语音识别问题。
提供机构:
智能系统与人工智能研究所
创建时间:
2020-12-05



