skypro1111/elevenlabs_dataset

Name: skypro1111/elevenlabs_dataset
Creator: skypro1111
Published: 2024-03-30 19:50:17
License: 暂无描述

Hugging Face2024-03-30 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/skypro1111/elevenlabs_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在探索使用合成数据集训练文本到语音（TTS）模型的概念。它包含1,388个音频文件及其对应的文本转录，总时长为2小时20分钟。数据集利用ChatGPT-4生成文本，ElevenLabs.io生成音频。该数据集可用于教育、研究和商业用途，需遵循MIT许可证。

提供机构：

skypro1111

原始信息汇总

Synthetic TTS Dataset

概述

该数据集旨在探索使用合成数据集训练文本到语音（TTS）模型的概念。它包含1,388个音频文件，总时长为2小时20分钟，以及相应的文本转录。该数据集利用了先进的AI服务，使用ChatGPT-4进行文本生成，使用ElevenLabs.io进行音频生成。

数据集组成

音频文件：1,388个文件
总时长：2小时20分钟
文本转录：每个音频文件对应的文本

目的

该数据集的主要目标是提供一个资源，用于测试和开发TTS模型，特别是评估合成数据集在训练此类模型中的有效性。

使用

该数据集在MIT许可证下分发，可自由用于教育、研究和商业目的，需适当署名。

模型训练

已使用该数据集训练了一个pflow模型，展示了其在TTS应用中的潜力：

模型检查点：Hugging Face - pyflowtts_uk_elevenlabs
代码库：GitHub - skypro1111/pflowtts_pytorch_uk

许可证

该数据集在cc-by-4.0许可证下提供。

引用

如果您在研究或项目中使用此数据集，请按以下方式引用：

@misc{synthetic_tts_dataset, author = {@skypro1111}, title = {Synthetic TTS Dataset for Training Models}, year = {2024}, publisher = {GitHub}, journal = {GitHub repository}, howpublished = {url{https://github.com/skypro1111/pflowtts_pytorch_uk}} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集