AISHELL-2
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/kaldi-asr/kaldi/tree/master/egs/aishell2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Aishell2,包含了用于目标语音提取任务中的目标说话人和干扰说话人的语音信号。数据集中包含了多种语音样本,旨在用于训练语音分离模型。该数据集的规模包括120,000个训练样本,14,000个验证样本以及7,000个测试样本,其任务重点是目标语音提取。
Named Aishell2, this dataset contains speech signals from target speakers and interfering speakers for target speech extraction tasks. It comprises diverse speech samples designed for training speech separation models, with a total scale of 120,000 training samples, 14,000 validation samples, and 7,000 test samples. The primary task focus of this dataset is target speech extraction.
提供机构:
Aishell
搜集汇总
数据集介绍

背景与挑战
背景概述
AISHELL-2是目前最大的免费普通话语音语料库,包含1000小时的语音数据和1991名说话者的样本,适用于非商业研究和教育用途。数据集提供了多种领域的朗读语音和三种录音通道的数据,并配套了基于Kaldi的中文ASR系统。
以上内容由遇见数据集搜集并总结生成



