AV16.3
收藏DataCite Commons2026-04-15 更新2024-07-13 收录
下载链接:
https://www.idiap.ch/dataset/av16-3/
下载链接
链接失效反馈官方服务:
资源简介:
The AV16.3 corpus is an audio-visual corpus of 43 real indoor multispeaker recordings, designed to test algorithms for audio-only, video-only and audio-visual speaker localization and tracking.
AV16.3语料库(AV16.3 corpus)是一款音视频语料库,包含43段真实室内多发言人录音,旨在测试仅音频、仅视频以及音视频融合的发言人定位与跟踪算法。
提供机构:
Idiap Research Institute
创建时间:
2021-01-19
搜集汇总
数据集介绍

背景与挑战
背景概述
AV16.3是一个专为说话人定位和跟踪算法设计的音频-视觉语料库,包含43个真实室内多说话人录音,特别关注重叠语音和移动说话人场景。数据集使用两个麦克风阵列和三个同步摄像头录制,并提供精确的3D标注,适用于会议和监控等多种应用场景。
以上内容由遇见数据集搜集并总结生成



