MikhailT/hifi-tts-light

Name: MikhailT/hifi-tts-light
Creator: MikhailT
Published: 2023-08-24 13:24:33
License: 暂无描述

Hugging Face2023-08-24 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/MikhailT/hifi-tts-light

下载链接

链接失效反馈

官方服务：

资源简介：

Hi-Fi多说话人英语TTS数据集（Hi-Fi TTS）基于LibriVox的公共领域有声读物和Gutenberg项目的文本。

The Hi-Fi multi-speaker English TTS dataset (Hi-Fi TTS) is based on public-domain audiobooks from LibriVox and texts from the Gutenberg Project.

提供机构：

MikhailT

原始信息汇总

数据集概述

数据集名称

HiFiTTS

描述

Hi-Fi Multi-Speaker English TTS Dataset (Hi-Fi TTS) 是基于 LibriVox 的公共领域有声书和 Gutenberg Project 文本构建的。

配置

clean
- 版本: 1.0.0
- 数据文件:
  - 训练集: data/train.clean*.parquet
  - 测试集: data/test.clean*.parquet
  - 开发集: data/dev.clean*.parquet
- 特征:
  - speaker: 字符串
  - file: 字符串
  - duration: float32
  - text: 字符串
  - text_no_preprocessing: 字符串
  - text_normalized: 字符串
  - audio: 音频，采样率 44100
- 分割:
  - 训练集: 1158544 字节, 9 个样本
  - 开发集: 904913 字节, 9 个样本
  - 测试集: 800999 字节, 9 个样本
- 下载大小: 0 字节
- 数据集大小: 2864456 字节
other
- 版本: 1.0.0
- 数据文件:
  - 训练集: data/train.other*.parquet
  - 测试集: data/test.other*.parquet
  - 开发集: data/dev.other*.parquet
- 特征:
  - speaker: 字符串
  - file: 字符串
  - duration: float32
  - text: 字符串
  - text_no_preprocessing: 字符串
  - text_normalized: 字符串
  - audio: 音频，采样率 44100
- 分割:
  - 训练集: 3632881 字节, 21 个样本
  - 开发集: 3255234 字节, 18 个样本
  - 测试集: 3180854 字节, 18 个样本
- 下载大小: 0 字节
- 数据集大小: 10068969 字节
all
- 版本: 1.0.0
- 数据文件:
  - 训练集 (clean): data/train.clean*.parquet
  - 训练集 (other): data/train.other*.parquet
  - 测试集 (clean): data/test.clean*.parquet
  - 测试集 (other): data/test.other*.parquet
  - 开发集 (clean): data/dev.clean*.parquet
  - 开发集 (other): data/dev.other*.parquet
- 特征:
  - speaker: 字符串
  - file: 字符串
  - duration: float32
  - text: 字符串
  - text_no_preprocessing: 字符串
  - text_normalized: 字符串
  - audio: 音频，采样率 44100
- 分割:
  - 训练集 (clean): 1158544 字节, 9 个样本
  - 训练集 (other): 3632881 字节, 21 个样本
  - 开发集 (clean): 904913 字节, 9 个样本
  - 开发集 (other): 3255234 字节, 18 个样本
  - 测试集 (clean): 800999 字节, 9 个样本
  - 测试集 (other): 3180854 字节, 18 个样本
- 下载大小: 0 字节
- 数据集大小: 12933425 字节

语言

英语 (en)

许可证

CC-BY-4.0

引用

@article{bakhturina2021hi, title={{Hi-Fi Multi-Speaker English TTS Dataset}}, author={Bakhturina, Evelina and Lavrukhin, Vitaly and Ginsburg, Boris and Zhang, Yang}, journal={arXiv preprint arXiv:2104.01497}, year={2021} }

搜集汇总

数据集介绍

背景与挑战

背景概述

HiFiTTS是一个基于公共领域资源构建的高保真多说话人英语TTS数据集，包含音频和文本数据，主要用于文本到语音任务。数据集规模较小，包含84行数据，分为不同子集和分割。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集