语音合成-中文-KANTTS-公开数据集
收藏魔搭社区2026-06-03 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/speech_tts/speech_kantts_opendata
下载链接
链接失效反馈官方服务:
资源简介:
# 语音合成-中文-KANTTS-公开数据集
## 数据集描述
和[https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary](https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary)完全相同,但是去除了csv文件,方便finetune时进行预处理
### 数据集简介
开发者运行[https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS) 所需要的配套样例数据,共379条,包含音频文件、标注信息,总时长约0.5小时。
### 数据集支持的任务
## 数据集的格式和结构
* interval: time alignment info of phones
* wav: raw audio file in .wav format
* prosody: transcriptions
### 数据格式
24K采样率,单通道音频。
## 数据集生成的相关信息
### 原始数据
## 数据集版权信息
数据集相关的版权信息,授权使用的场景和用户。是否开源,以及采用哪个开源协议等等。
## 引用方式
无
## 其他相关信息
无
# 语音合成-中文-KANTTS-公开数据集
## 数据集说明
本数据集与[https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary](https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary)对应的数据集完全一致,但移除了CSV文件,便于微调(finetune)阶段的预处理工作。
### 数据集概况
开发者运行[https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS)所需的配套示例数据,总计379条样本,涵盖音频文件与标注信息,总时长约0.5小时。
### 支持的任务
## 数据集格式与结构
* interval:音素(phone)的时间对齐信息
* wav:.wav格式的原始音频文件
* prosody:语音转写文本
### 数据格式
采用24kHz采样率的单声道音频。
## 数据集生成相关信息
### 原始数据
## 数据集版权声明
包含数据集相关的版权声明、授权使用场景与适用用户、是否开源及所采用的开源协议等内容。
## 引用方式
无
## 其他相关信息
无
提供机构:
maas
创建时间:
2022-12-07
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是KAN-TTS项目的配套中文语音合成数据集,包含379条24K采样率的单通道音频及标注信息,适用于语音合成任务,采用MIT开源协议。
以上内容由遇见数据集搜集并总结生成



