five

VoxCeleb2 语音识别数据集

收藏
超神经2022-08-04 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/15551
下载链接
链接失效反馈
官方服务:
资源简介:
VoxCeleb2 是一个源自开源媒体的大规模说话人 (Speaker) 识别数据集,由超过 6 千名说话者的一百万条语料组成。由于该数据集是在自然场景中收集的,因此语音片段中不乏笑声、交谈声、频道效果、音乐等干扰。

VoxCeleb2 is a large-scale speaker recognition dataset sourced from open-source media, comprising over one million speech utterances from more than 6,000 speakers. As the dataset was collected in natural scenarios, the speech segments contain various interferences such as laughter, background conversations, channel artifacts, and music.
创建时间:
2022-06-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
VoxCeleb2是一个大规模说话人识别数据集,由超过6千名说话者的100万条多语言语料组成,采集自自然场景,涵盖145个国家的口音、年龄、种族和语种。该数据集包含音频和视频,适用于语音合成、语音分离及跨模态转换等任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务