JusperLee/VoxCeleb2-2Mix

Name: JusperLee/VoxCeleb2-2Mix
Creator: JusperLee
Published: 2024-02-20 17:40:07
License: 暂无描述

Hugging Face2024-02-20 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/JusperLee/VoxCeleb2-2Mix

下载链接

链接失效反馈

官方服务：

资源简介：

VoxCeleb2数据集包含从YouTube视频中提取的超过100万句话，来自6,112个不同的个体，分为Dev和Test文件夹。与之前的研究保持一致，从Dev文件夹中选取5%的数据来创建训练和验证集。类似于LRS2，VoxCeleb2也包含大量的噪声和混响，使其更接近真实世界的场景，但VoxCeleb2的声学环境更为复杂和具有挑战性。数据集包括56小时的训练集、3小时的验证集和1.5小时的测试集。

提供机构：

JusperLee

原始信息汇总

数据集概述

基本信息

许可证：Apache-2.0
语言：英语
标签：语音分离
数据集大小：100M<n<1B

详细描述

数据来源：VoxCeleb2数据集包含超过一百万条来自6,112名个体的句子，这些句子从YouTube视频中提取，分为Dev和Test文件夹。
数据选择：该数据集使用了与先前研究（Li et al., 2022; Gao & Grauman, 2021; Lee et al., 2021）一致的构建方法，从VoxCeleb2的Dev文件夹中选取了5%的数据用于创建训练和验证集。
数据特点：类似于LRS2，VoxCeleb2包含大量噪声和混响，更接近真实世界场景，但其声学环境更为复杂和具有挑战性。
数据集划分：包含56小时的训练集、3小时的验证集和1.5小时的测试集。

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是基于VoxCeleb2构建的语音分离数据集，包含大量噪声和混响，模拟真实世界声学环境，适用于语音分离研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集