five

达摩院语音KAN-TTS开源数据集

收藏
魔搭社区2026-05-23 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset
下载链接
链接失效反馈
官方服务:
资源简介:
# 达摩院语音KAN-TTS开源数据集 ## 数据集描述 KAN-TTS样例数据集 ### 数据集简介 开发者运行[https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS) 所需要的配套样例数据,共379条,包含音频文件、标注信息,总时长约0.5小时。 ### 数据集支持的任务 ## 数据集的格式和结构 * interval: time alignment info of phones * wav: raw audio file in .wav format * prosody: transcriptions ### 数据格式 24K采样率,单通道音频。 ## 数据集生成的相关信息 ### 原始数据 ## 数据集版权信息 数据集相关的版权信息,授权使用的场景和用户。是否开源,以及采用哪个开源协议等等。 ## 引用方式 无 ## 其他相关信息 无

# Alibaba DAMO Academy KAN-TTS Open Source Dataset ## Dataset Description KAN-TTS Sample Dataset ### Dataset Introduction This is supporting sample data required for developers to run the project hosted at [https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS). It consists of 379 entries in total, including audio files and annotation information, with a total duration of approximately 0.5 hours. ### Supported Tasks ## Dataset Format and Structure * interval: Time alignment information of phonemes * wav: Raw audio files in .wav format * prosody: Transcriptions ### Data Format 24kHz sampling rate, single-channel audio. ## Relevant Information for Dataset Generation ### Raw Data ## Dataset Copyright Information Copyright information related to the dataset, including authorized usage scenarios, applicable users, whether it is open source, and the specific open source license adopted, etc. ## Citation None ## Other Relevant Information None
提供机构:
maas
创建时间:
2022-08-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是达摩院KAN-TTS的开源样本数据,包含379条音频文件及标注信息,总时长约0.5小时,采样率为24K单声道,旨在为开发者运行KAN-TTS项目提供支持。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务