达摩院语音KAN-TTS开源数据集
收藏魔搭社区2026-05-23 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/modelscope/DAMO.NLS.KAN-TTS.OpenDataset
下载链接
链接失效反馈官方服务:
资源简介:
# 达摩院语音KAN-TTS开源数据集
## 数据集描述
KAN-TTS样例数据集
### 数据集简介
开发者运行[https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS) 所需要的配套样例数据,共379条,包含音频文件、标注信息,总时长约0.5小时。
### 数据集支持的任务
## 数据集的格式和结构
* interval: time alignment info of phones
* wav: raw audio file in .wav format
* prosody: transcriptions
### 数据格式
24K采样率,单通道音频。
## 数据集生成的相关信息
### 原始数据
## 数据集版权信息
数据集相关的版权信息,授权使用的场景和用户。是否开源,以及采用哪个开源协议等等。
## 引用方式
无
## 其他相关信息
无
# Alibaba DAMO Academy KAN-TTS Open Source Dataset
## Dataset Description
KAN-TTS Sample Dataset
### Dataset Introduction
This is supporting sample data required for developers to run the project hosted at [https://github.com/AlibabaResearch/KAN-TTS](https://github.com/AlibabaResearch/KAN-TTS). It consists of 379 entries in total, including audio files and annotation information, with a total duration of approximately 0.5 hours.
### Supported Tasks
## Dataset Format and Structure
* interval: Time alignment information of phonemes
* wav: Raw audio files in .wav format
* prosody: Transcriptions
### Data Format
24kHz sampling rate, single-channel audio.
## Relevant Information for Dataset Generation
### Raw Data
## Dataset Copyright Information
Copyright information related to the dataset, including authorized usage scenarios, applicable users, whether it is open source, and the specific open source license adopted, etc.
## Citation
None
## Other Relevant Information
None
提供机构:
maas
创建时间:
2022-08-25
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是达摩院KAN-TTS的开源样本数据,包含379条音频文件及标注信息,总时长约0.5小时,采样率为24K单声道,旨在为开发者运行KAN-TTS项目提供支持。
以上内容由遇见数据集搜集并总结生成



