skypro1111/elevenlabs_dataset
收藏Hugging Face2024-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/skypro1111/elevenlabs_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集旨在探索使用合成数据集训练文本到语音(TTS)模型的概念。它包含1,388个音频文件及其对应的文本转录,总时长为2小时20分钟。数据集利用ChatGPT-4生成文本,ElevenLabs.io生成音频。该数据集可用于教育、研究和商业用途,需遵循MIT许可证。
该数据集旨在探索使用合成数据集训练文本到语音(TTS)模型的概念。它包含1,388个音频文件及其对应的文本转录,总时长为2小时20分钟。数据集利用ChatGPT-4生成文本,ElevenLabs.io生成音频。该数据集可用于教育、研究和商业用途,需遵循MIT许可证。
提供机构:
skypro1111
原始信息汇总
Synthetic TTS Dataset
概述
该数据集旨在探索使用合成数据集训练文本到语音(TTS)模型的概念。它包含1,388个音频文件,总时长为2小时20分钟,以及相应的文本转录。该数据集利用了先进的AI服务,使用ChatGPT-4进行文本生成,使用ElevenLabs.io进行音频生成。
数据集组成
- 音频文件:1,388个文件
- 总时长:2小时20分钟
- 文本转录:每个音频文件对应的文本
目的
该数据集的主要目标是提供一个资源,用于测试和开发TTS模型,特别是评估合成数据集在训练此类模型中的有效性。
使用
该数据集在MIT许可证下分发,可自由用于教育、研究和商业目的,需适当署名。
模型训练
已使用该数据集训练了一个pflow模型,展示了其在TTS应用中的潜力:
许可证
该数据集在cc-by-4.0许可证下提供。
引用
如果您在研究或项目中使用此数据集,请按以下方式引用:
@misc{synthetic_tts_dataset, author = {@skypro1111}, title = {Synthetic TTS Dataset for Training Models}, year = {2024}, publisher = {GitHub}, journal = {GitHub repository}, howpublished = {url{https://github.com/skypro1111/pflowtts_pytorch_uk}} }



