语音合成-中文-KANTTS-公开数据集

Name: 语音合成-中文-KANTTS-公开数据集
Creator: maas
Published: 2026-06-03 15:25:49
License: 暂无描述

魔搭社区2026-06-03 更新2024-05-15 收录

下载链接：

https://modelscope.cn/datasets/speech_tts/speech_kantts_opendata

下载链接

链接失效反馈

官方服务：

资源简介：

# 语音合成-中文-KANTTS-公开数据集 ## 数据集描述和[https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary](https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary)完全相同，但是去除了csv文件，方便finetune时进行预处理 ### 数据集简介开发者运行[https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS) 所需要的配套样例数据，共379条，包含音频文件、标注信息，总时长约0.5小时。 ### 数据集支持的任务 ## 数据集的格式和结构 * interval: time alignment info of phones * wav: raw audio file in .wav format * prosody: transcriptions ### 数据格式 24K采样率，单通道音频。 ## 数据集生成的相关信息 ### 原始数据 ## 数据集版权信息数据集相关的版权信息，授权使用的场景和用户。是否开源，以及采用哪个开源协议等等。 ## 引用方式无 ## 其他相关信息无

# 语音合成-中文-KANTTS-公开数据集 ## 数据集说明本数据集与[https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary](https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary)对应的数据集完全一致，但移除了CSV文件，便于微调（finetune）阶段的预处理工作。 ### 数据集概况开发者运行[https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS)所需的配套示例数据，总计379条样本，涵盖音频文件与标注信息，总时长约0.5小时。 ### 支持的任务 ## 数据集格式与结构 * interval：音素（phone）的时间对齐信息 * wav：.wav格式的原始音频文件 * prosody：语音转写文本 ### 数据格式采用24kHz采样率的单声道音频。 ## 数据集生成相关信息 ### 原始数据 ## 数据集版权声明包含数据集相关的版权声明、授权使用场景与适用用户、是否开源及所采用的开源协议等内容。 ## 引用方式无 ## 其他相关信息无

提供机构：

maas

创建时间：

2022-12-07

搜集汇总

数据集介绍