five

AV16.3

收藏
DataCite Commons2026-04-15 更新2024-07-13 收录
下载链接:
https://www.idiap.ch/dataset/av16-3/
下载链接
链接失效反馈
官方服务:
资源简介:
The AV16.3 corpus is an audio-visual corpus of 43 real indoor multispeaker recordings, designed to test algorithms for audio-only, video-only and audio-visual speaker localization and tracking.

AV16.3语料库(AV16.3 corpus)是一款音视频语料库,包含43段真实室内多发言人录音,旨在测试仅音频、仅视频以及音视频融合的发言人定位与跟踪算法。
提供机构:
Idiap Research Institute
创建时间:
2021-01-19
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AV16.3是一个专为说话人定位和跟踪算法设计的音频-视觉语料库,包含43个真实室内多说话人录音,特别关注重叠语音和移动说话人场景。数据集使用两个麦克风阵列和三个同步摄像头录制,并提供精确的3D标注,适用于会议和监控等多种应用场景。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作