reach-vb/jenny_tts_dataset

Name: reach-vb/jenny_tts_dataset
Creator: reach-vb
Published: 2024-01-09 14:11:57
License: 暂无描述

Hugging Face2024-01-09 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/reach-vb/jenny_tts_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Jenny TTS数据集是一个高质量、多样化的约30小时语音数据集，适合用于训练TTS模型。录音由爱尔兰人Jenny完成，内容包括报纸头条、各种YouTube视频的转录、书籍《1984》和《小妇人》的部分内容、维基百科文章（哲学、历史、科学等）、食谱、Reddit评论、歌词（包括说唱歌词）以及电视剧《老友记》的转录。音频文件为48kHz、16位PCM格式，双声道（使用单一麦克风）。从原始来源获取文本时进行了一些轻度的预处理。音频文件为原始录音，未经过修剪，可能包含几秒钟的静音或轻微的敲击声。使用该数据集生成的音频在用户操作响应中需要注明来源为“Jenny”或“Jenny (Dioco)”，商业用途允许。Jenny可提供进一步录音服务。

提供机构：

reach-vb

原始信息汇总

数据集概述

数据集名称

Jenny TTS Dataset

数据集描述

一个高质量、多样化的约30小时语音数据集，适合用于训练TTS模型。

数据特征

file_name：文件名，数据类型为字符串。
transcription：转录文本，数据类型为字符串。
transcription_normalised：规范化转录文本，数据类型为字符串。
audio：音频数据，数据类型为音频。

数据集分割

train：训练集，包含20978个样本，总大小为4983072167.73字节。

数据集大小

下载大小：3741291896字节
数据集总大小：4983072167.73字节

数据内容

包含多种类型的文本材料，如报纸头条、YouTube视频转录、书籍摘录、Wikipedia文章、食谱、Reddit评论、歌词等。
音频文件为48kHz，16位PCM格式，双声道。

注意事项

音频文件为原始录音，未经过剪辑，可能包含几秒钟的静音或开始时的轻敲声。

许可证

使用此数据集生成的音频需在软件、网站、项目或接口中提及声音来源为“Jenny”，并在可能的情况下加上“Jenny (Dioco)”。
商业使用允许，不得声称数据集为个人所有。

5,000+

优质数据集

54 个

任务类型

进入经典数据集