five

JusperLee/VoxCeleb2-2Mix

收藏
Hugging Face2024-02-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/JusperLee/VoxCeleb2-2Mix
下载链接
链接失效反馈
官方服务:
资源简介:
VoxCeleb2数据集包含从YouTube视频中提取的超过100万句话,来自6,112个不同的个体,分为Dev和Test文件夹。与之前的研究保持一致,从Dev文件夹中选取5%的数据来创建训练和验证集。类似于LRS2,VoxCeleb2也包含大量的噪声和混响,使其更接近真实世界的场景,但VoxCeleb2的声学环境更为复杂和具有挑战性。数据集包括56小时的训练集、3小时的验证集和1.5小时的测试集。

VoxCeleb2数据集包含从YouTube视频中提取的超过100万句话,来自6,112个不同的个体,分为Dev和Test文件夹。与之前的研究保持一致,从Dev文件夹中选取5%的数据来创建训练和验证集。类似于LRS2,VoxCeleb2也包含大量的噪声和混响,使其更接近真实世界的场景,但VoxCeleb2的声学环境更为复杂和具有挑战性。数据集包括56小时的训练集、3小时的验证集和1.5小时的测试集。
提供机构:
JusperLee
原始信息汇总

数据集概述

基本信息

  • 许可证:Apache-2.0
  • 语言:英语
  • 标签:语音分离
  • 数据集大小:100M<n<1B

详细描述

  • 数据来源:VoxCeleb2数据集包含超过一百万条来自6,112名个体的句子,这些句子从YouTube视频中提取,分为Dev和Test文件夹。
  • 数据选择:该数据集使用了与先前研究(Li et al., 2022; Gao & Grauman, 2021; Lee et al., 2021)一致的构建方法,从VoxCeleb2的Dev文件夹中选取了5%的数据用于创建训练和验证集。
  • 数据特点:类似于LRS2,VoxCeleb2包含大量噪声和混响,更接近真实世界场景,但其声学环境更为复杂和具有挑战性。
  • 数据集划分:包含56小时的训练集、3小时的验证集和1.5小时的测试集。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是基于VoxCeleb2构建的语音分离数据集,包含大量噪声和混响,模拟真实世界声学环境,适用于语音分离研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作