reach-vb/jenny_tts_dataset
收藏Hugging Face2024-01-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/reach-vb/jenny_tts_dataset
下载链接
链接失效反馈官方服务:
资源简介:
Jenny TTS数据集是一个高质量、多样化的约30小时语音数据集,适合用于训练TTS模型。录音由爱尔兰人Jenny完成,内容包括报纸头条、各种YouTube视频的转录、书籍《1984》和《小妇人》的部分内容、维基百科文章(哲学、历史、科学等)、食谱、Reddit评论、歌词(包括说唱歌词)以及电视剧《老友记》的转录。音频文件为48kHz、16位PCM格式,双声道(使用单一麦克风)。从原始来源获取文本时进行了一些轻度的预处理。音频文件为原始录音,未经过修剪,可能包含几秒钟的静音或轻微的敲击声。使用该数据集生成的音频在用户操作响应中需要注明来源为“Jenny”或“Jenny (Dioco)”,商业用途允许。Jenny可提供进一步录音服务。
提供机构:
reach-vb
原始信息汇总
数据集概述
数据集名称
Jenny TTS Dataset
数据集描述
一个高质量、多样化的约30小时语音数据集,适合用于训练TTS模型。
数据特征
- file_name:文件名,数据类型为字符串。
- transcription:转录文本,数据类型为字符串。
- transcription_normalised:规范化转录文本,数据类型为字符串。
- audio:音频数据,数据类型为音频。
数据集分割
- train:训练集,包含20978个样本,总大小为4983072167.73字节。
数据集大小
- 下载大小:3741291896字节
- 数据集总大小:4983072167.73字节
数据内容
- 包含多种类型的文本材料,如报纸头条、YouTube视频转录、书籍摘录、Wikipedia文章、食谱、Reddit评论、歌词等。
- 音频文件为48kHz,16位PCM格式,双声道。
注意事项
- 音频文件为原始录音,未经过剪辑,可能包含几秒钟的静音或开始时的轻敲声。
许可证
- 使用此数据集生成的音频需在软件、网站、项目或接口中提及声音来源为“Jenny”,并在可能的情况下加上“Jenny (Dioco)”。
- 商业使用允许,不得声称数据集为个人所有。



