five

skypro1111/elevenlabs_dataset

收藏
Hugging Face2024-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/skypro1111/elevenlabs_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集旨在探索使用合成数据集训练文本到语音(TTS)模型的概念。它包含1,388个音频文件及其对应的文本转录,总时长为2小时20分钟。数据集利用ChatGPT-4生成文本,ElevenLabs.io生成音频。该数据集可用于教育、研究和商业用途,需遵循MIT许可证。

该数据集旨在探索使用合成数据集训练文本到语音(TTS)模型的概念。它包含1,388个音频文件及其对应的文本转录,总时长为2小时20分钟。数据集利用ChatGPT-4生成文本,ElevenLabs.io生成音频。该数据集可用于教育、研究和商业用途,需遵循MIT许可证。
提供机构:
skypro1111
原始信息汇总

Synthetic TTS Dataset

概述

该数据集旨在探索使用合成数据集训练文本到语音(TTS)模型的概念。它包含1,388个音频文件,总时长为2小时20分钟,以及相应的文本转录。该数据集利用了先进的AI服务,使用ChatGPT-4进行文本生成,使用ElevenLabs.io进行音频生成。

数据集组成

  • 音频文件:1,388个文件
  • 总时长:2小时20分钟
  • 文本转录:每个音频文件对应的文本

目的

该数据集的主要目标是提供一个资源,用于测试和开发TTS模型,特别是评估合成数据集在训练此类模型中的有效性。

使用

该数据集在MIT许可证下分发,可自由用于教育、研究和商业目的,需适当署名。

模型训练

已使用该数据集训练了一个pflow模型,展示了其在TTS应用中的潜力:

许可证

该数据集在cc-by-4.0许可证下提供。

引用

如果您在研究或项目中使用此数据集,请按以下方式引用:

@misc{synthetic_tts_dataset, author = {@skypro1111}, title = {Synthetic TTS Dataset for Training Models}, year = {2024}, publisher = {GitHub}, journal = {GitHub repository}, howpublished = {url{https://github.com/skypro1111/pflowtts_pytorch_uk}} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作