five

语音合成-中文-KANTTS-公开数据集

收藏
魔搭社区2026-06-03 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/speech_tts/speech_kantts_opendata
下载链接
链接失效反馈
官方服务:
资源简介:
# 语音合成-中文-KANTTS-公开数据集 ## 数据集描述 和[https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary](https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary)完全相同,但是去除了csv文件,方便finetune时进行预处理 ### 数据集简介 开发者运行[https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS) 所需要的配套样例数据,共379条,包含音频文件、标注信息,总时长约0.5小时。 ### 数据集支持的任务 ## 数据集的格式和结构 * interval: time alignment info of phones * wav: raw audio file in .wav format * prosody: transcriptions ### 数据格式 24K采样率,单通道音频。 ## 数据集生成的相关信息 ### 原始数据 ## 数据集版权信息 数据集相关的版权信息,授权使用的场景和用户。是否开源,以及采用哪个开源协议等等。 ## 引用方式 无 ## 其他相关信息 无

# 语音合成-中文-KANTTS-公开数据集 ## 数据集说明 本数据集与[https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary](https://www.modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset/summary)对应的数据集完全一致,但移除了CSV文件,便于微调(finetune)阶段的预处理工作。 ### 数据集概况 开发者运行[https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS)所需的配套示例数据,总计379条样本,涵盖音频文件与标注信息,总时长约0.5小时。 ### 支持的任务 ## 数据集格式与结构 * interval:音素(phone)的时间对齐信息 * wav:.wav格式的原始音频文件 * prosody:语音转写文本 ### 数据格式 采用24kHz采样率的单声道音频。 ## 数据集生成相关信息 ### 原始数据 ## 数据集版权声明 包含数据集相关的版权声明、授权使用场景与适用用户、是否开源及所采用的开源协议等内容。 ## 引用方式 无 ## 其他相关信息 无
提供机构:
maas
创建时间:
2022-12-07
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是KAN-TTS项目的配套中文语音合成数据集,包含379条24K采样率的单通道音频及标注信息,适用于语音合成任务,采用MIT开源协议。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务