AISHELL-3
收藏魔搭社区2026-06-06 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/OmniData/AISHELL-3
下载链接
链接失效反馈官方服务:
资源简介:
displayName: AISHELL-3
labelTypes:
- Chinese Corpus
license:
- Apache 2.0
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2010.11567v2.pdf
publishDate: "2020"
publishUrl: http://www.aishelltech.com/aishell_3
publisher:
- Beijing shell technology
tags:
- Word
- Recording
taskTypes:
- Text-To-Speech Synthesis
---
# 数据集介绍
## 简介
AISHELL-3 是一个大规模、高保真的多说话人普通话语料库,可用于训练多说话人文本到语音(TTS)系统。该语料库包含大约 85 小时的情绪中性录音,由 218 位以汉语为母语的人讲过,总共有 88035 条话语。它们的性别、年龄组和母语口音等辅助属性在语料库中被明确标记和提供。相应地,在录音的同时还提供了汉字级和拼音级的成绩单。通过专业的语音标注和严格的语调质量检测,词音转录准确率在98%以上。
## 引文
```
@article{shi2020aishell,
title={Aishell-3: A multi-speaker mandarin tts corpus and the baselines},
author={Shi, Yao and Bu, Hui and Xu, Xin and Zhang, Shaoji and Li, Ming},
journal={arXiv preprint arXiv:2010.11567},
year={2020}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: AISHELL-3
labelTypes:
- 中文语料库(Chinese Corpus)
license:
- Apache 2.0
mediaTypes:
- 文本(Text)
paperUrl: https://arxiv.org/pdf/2010.11567v2.pdf
publishDate: "2020"
publishUrl: http://www.aishelltech.com/aishell_3
publisher:
- 北京壳科技(Beijing shell technology)
tags:
- 词语(Word)
- 录音(Recording)
taskTypes:
- 文本到语音合成(Text-To-Speech Synthesis)
---
# 数据集介绍
## 简介
AISHELL-3 是一款大规模、高保真的多说话人普通话语料库,可用于训练多说话人文本到语音合成(Text-To-Speech Synthesis)系统。该语料库包含约85小时的情绪中性语音录音,由218名汉语母语者录制,总计88035条语音片段。语料库中已明确标注并提供了每位说话人的性别、年龄组别、母语口音等辅助属性。同步配套了汉字级与拼音级的转写文本,经专业语音标注与严格的语调质量校验,词音转写准确率可达98%以上。
## 引文
@article{shi2020aishell,
title={Aishell-3: A multi-speaker mandarin tts corpus and the baselines},
author={Shi, Yao and Bu, Hui and Xu, Xin and Zhang, Shaoji and Li, Ming},
journal={arXiv preprint arXiv:2010.11567},
year={2020}
}
## 下载数据集
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-06-29
搜集汇总
数据集介绍

背景与挑战
背景概述
AISHELL-3是一个大规模、高保真的多说话人普通话语料库,专门用于训练多说话人文本到语音(TTS)系统。它包含约85小时的录音,由218名母语为普通话的说话人录制,总计88,035条话语,并标注了性别、年龄和口音等辅助属性,同时提供字符级和拼音级转录,音素转录准确率超过98%。
以上内容由遇见数据集搜集并总结生成



