five

reach-vb/jenny_tts_dataset

收藏
Hugging Face2024-01-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/reach-vb/jenny_tts_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Jenny TTS数据集是一个高质量、多样化的约30小时语音数据集,适合用于训练TTS模型。录音由爱尔兰人Jenny完成,内容包括报纸头条、各种YouTube视频的转录、书籍《1984》和《小妇人》的部分内容、维基百科文章(哲学、历史、科学等)、食谱、Reddit评论、歌词(包括说唱歌词)以及电视剧《老友记》的转录。音频文件为48kHz、16位PCM格式,双声道(使用单一麦克风)。从原始来源获取文本时进行了一些轻度的预处理。音频文件为原始录音,未经过修剪,可能包含几秒钟的静音或轻微的敲击声。使用该数据集生成的音频在用户操作响应中需要注明来源为“Jenny”或“Jenny (Dioco)”,商业用途允许。Jenny可提供进一步录音服务。
提供机构:
reach-vb
原始信息汇总

数据集概述

数据集名称

Jenny TTS Dataset

数据集描述

一个高质量、多样化的约30小时语音数据集,适合用于训练TTS模型。

数据特征

  • file_name:文件名,数据类型为字符串。
  • transcription:转录文本,数据类型为字符串。
  • transcription_normalised:规范化转录文本,数据类型为字符串。
  • audio:音频数据,数据类型为音频。

数据集分割

  • train:训练集,包含20978个样本,总大小为4983072167.73字节。

数据集大小

  • 下载大小:3741291896字节
  • 数据集总大小:4983072167.73字节

数据内容

  • 包含多种类型的文本材料,如报纸头条、YouTube视频转录、书籍摘录、Wikipedia文章、食谱、Reddit评论、歌词等。
  • 音频文件为48kHz,16位PCM格式,双声道。

注意事项

  • 音频文件为原始录音,未经过剪辑,可能包含几秒钟的静音或开始时的轻敲声。

许可证

  • 使用此数据集生成的音频需在软件、网站、项目或接口中提及声音来源为“Jenny”,并在可能的情况下加上“Jenny (Dioco)”。
  • 商业使用允许,不得声称数据集为个人所有。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作