VoxCeleb2
收藏arXiv2025-09-30 收录
下载链接:
https://www.robots.ox.ac.uk/~vgg/data/voxceleb/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了超过一百万个视频,涉及6,112个身份,这些数据被用于CoRF训练。在使用之前,该数据集需要经过预处理以清理数据。该数据集的任务包括人脸识别和动态人脸合成。
This dataset contains over one million video clips, covering 6,112 unique identities, and is used for CoRF training. Prior to being utilized, this dataset requires preprocessing to clean the data. The tasks supported by this dataset include face recognition and dynamic face synthesis.
搜集汇总
数据集介绍

背景与挑战
背景概述
VoxCeleb2是一个大规模音频-视觉数据集,包含超过100万个话语片段,来自6112位名人,语音片段提取自YouTube访谈视频。该数据集的特点是说话者多样性高(涵盖不同种族、口音、职业和年龄),且所有语音均在'野生'条件下捕获,包含背景噪音、重叠语音和光照变化等真实场景干扰,适用于无约束条件下的说话人识别研究。
以上内容由遇见数据集搜集并总结生成



