JusperLee/VoxCeleb2-2Mix
收藏Hugging Face2024-02-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/JusperLee/VoxCeleb2-2Mix
下载链接
链接失效反馈官方服务:
资源简介:
VoxCeleb2数据集包含从YouTube视频中提取的超过100万句话,来自6,112个不同的个体,分为Dev和Test文件夹。与之前的研究保持一致,从Dev文件夹中选取5%的数据来创建训练和验证集。类似于LRS2,VoxCeleb2也包含大量的噪声和混响,使其更接近真实世界的场景,但VoxCeleb2的声学环境更为复杂和具有挑战性。数据集包括56小时的训练集、3小时的验证集和1.5小时的测试集。
VoxCeleb2数据集包含从YouTube视频中提取的超过100万句话,来自6,112个不同的个体,分为Dev和Test文件夹。与之前的研究保持一致,从Dev文件夹中选取5%的数据来创建训练和验证集。类似于LRS2,VoxCeleb2也包含大量的噪声和混响,使其更接近真实世界的场景,但VoxCeleb2的声学环境更为复杂和具有挑战性。数据集包括56小时的训练集、3小时的验证集和1.5小时的测试集。
提供机构:
JusperLee
原始信息汇总
数据集概述
基本信息
- 许可证:Apache-2.0
- 语言:英语
- 标签:语音分离
- 数据集大小:100M<n<1B
详细描述
- 数据来源:VoxCeleb2数据集包含超过一百万条来自6,112名个体的句子,这些句子从YouTube视频中提取,分为Dev和Test文件夹。
- 数据选择:该数据集使用了与先前研究(Li et al., 2022; Gao & Grauman, 2021; Lee et al., 2021)一致的构建方法,从VoxCeleb2的Dev文件夹中选取了5%的数据用于创建训练和验证集。
- 数据特点:类似于LRS2,VoxCeleb2包含大量噪声和混响,更接近真实世界场景,但其声学环境更为复杂和具有挑战性。
- 数据集划分:包含56小时的训练集、3小时的验证集和1.5小时的测试集。
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是基于VoxCeleb2构建的语音分离数据集,包含大量噪声和混响,模拟真实世界声学环境,适用于语音分离研究。
以上内容由遇见数据集搜集并总结生成



