VoxCeleb2 语音识别数据集
收藏超神经2022-08-04 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/15551
下载链接
链接失效反馈官方服务:
资源简介:
VoxCeleb2 是一个源自开源媒体的大规模说话人 (Speaker) 识别数据集,由超过 6 千名说话者的一百万条语料组成。由于该数据集是在自然场景中收集的,因此语音片段中不乏笑声、交谈声、频道效果、音乐等干扰。
VoxCeleb2 is a large-scale speaker recognition dataset sourced from open-source media, comprising over one million speech utterances from more than 6,000 speakers. As the dataset was collected in natural scenarios, the speech segments contain various interferences such as laughter, background conversations, channel artifacts, and music.
创建时间:
2022-06-20
搜集汇总
数据集介绍

背景与挑战
背景概述
VoxCeleb2是一个大规模说话人识别数据集,由超过6千名说话者的100万条多语言语料组成,采集自自然场景,涵盖145个国家的口音、年龄、种族和语种。该数据集包含音频和视频,适用于语音合成、语音分离及跨模态转换等任务。
以上内容由遇见数据集搜集并总结生成



