open_tts_tracker

Hugging Face2024-10-15 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/Pendrokar/open_tts_tracker

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多种TTS模型，每个模型都有详细的描述，包括GitHub仓库、权重、许可证、微调支持、语言支持、论文、演示和问题等信息。数据集配置为默认配置，数据文件格式为TSV，分隔符为制表符，数据集大小类别为n<1K。

This dataset contains various Text-to-Speech (TTS) models. Each model is accompanied by detailed information including its GitHub repository, model weights, license, fine-tuning support, supported languages, associated academic papers, demos, and issue-related details. The dataset uses the default configuration, with data files stored in TSV format where the delimiter is a tab character, and its size category is defined as n<1K.

创建时间：

2024-10-14

原始信息汇总

Open TTS Tracker 数据集概述

数据集配置

配置名称: default
数据文件格式: *.tsv
分隔符: 制表符 ( )
数据规模: n<1K

数据集内容

该数据集包含多个TTS（文本到语音）模型的详细信息，包括模型的名称、GitHub仓库、权重、许可证、微调能力、支持的语言、论文、演示和问题。以下是部分模型的详细信息：

名称	GitHub	权重	许可证	微调	语言	论文	演示	问题
AI4Bharat	Repo	Hub	MIT	Yes	Indic	Paper	Demo
Amphion	Repo	Hub	MIT	No	Multilingual	Paper	🤗 Space
Bark	Repo	Hub	MIT	No	Multilingual	Paper	🤗 Space
EmotiVoice	Repo	GDrive	Apache 2.0	Yes	ZH + EN	Not Available	Not Available	Separate GUI agreement
F5-TTS	Repo	Hub	MIT	Yes	ZH + EN	Paper	🤗 Space
Glow-TTS	Repo	GDrive	MIT	Yes	English	Paper	GH Pages
GPT-SoVITS	Repo	Hub	MIT	Yes	Multilingual	Not Available	Not Available
HierSpeech++	Repo	GDrive	MIT	No	KR + EN	Paper	🤗 Space
IMS-Toucan	Repo	GH release	Apache 2.0	Yes	Multilingual	Paper	🤗 Space
MahaTTS	Repo	Hub	Apache 2.0	No	English + Indic	Not Available	Recordings, Colab
Matcha-TTS	Repo	GDrive	MIT	Yes	English	Paper	🤗 Space	GPL-licensed phonemizer
MeloTTS	Repo	Hub	MIT	Yes	Multilingual	Not Available	🤗 Space
MetaVoice-1B	Repo	Hub	Apache 2.0	Yes	Multilingual	Not Available	🤗 Space
Neural-HMM TTS	Repo	GitHub	MIT	Yes	English	Paper	GH Pages
OpenVoice	Repo	Hub	MIT	No	Multilingual	Paper	🤗 Space
OverFlow TTS	Repo	GitHub	MIT	Yes	English	Paper	GH Pages
Parler TTS	Repo	Hub	Apache 2.0	Yes	English	Not Available	🤗 Space
pflowTTS	Unofficial Repo	GDrive	MIT	Yes	English	Paper	Not Available	GPL-licensed phonemizer
Pheme	Repo	Hub	CC-BY	Yes	English	Paper	🤗 Space
Piper	Repo	Hub	MIT	Yes	Multilingual	Not Available	Not Available	GPL-licensed phonemizer
RAD-MMM	Repo	GDrive	MIT	Yes	Multilingual	Paper	Jupyter Notebook, Webpage
RAD-TTS	Repo	GDrive	MIT	Yes	English	Paper	GH Pages
Silero	Repo	GH links	CC BY-NC-SA	No	Multilingual	Not Available	Not Available	Non Commercial
StyleTTS 2	Repo	Hub	MIT	Yes	English	Paper	🤗 Space	GPL-licensed phonemizer
Tacotron 2	Unofficial Repo	GDrive	BSD-3	[Yes](https://github.com/NVIDIA/tacotron2/tree/master?tab

搜集汇总

数据集介绍

构建方式

open_tts_tracker数据集的构建旨在追踪所有开源或公开访问的文本到语音（TTS）模型。该数据集通过整合多个TTS模型的元数据，包括GitHub仓库链接、权重文件、许可证信息、微调能力、支持的语言、相关论文及演示链接等，形成一个全面的资源库。数据集的构建过程依赖于社区贡献，用户可以通过提交Pull Request来更新或添加新的模型信息，确保数据集能够及时反映TTS领域的最新进展。

使用方法

open_tts_tracker数据集的使用方法较为灵活，适用于多种场景。研究人员可以通过该数据集快速了解当前TTS领域的主流模型及其技术特点，从而为研究提供参考。开发者可以利用数据集中的模型信息，选择合适的TTS模型进行集成或二次开发。此外，数据集还提供了模型演示链接，用户可以直接体验不同模型的语音合成效果。对于希望贡献新模型的用户，可以通过提交Pull Request来更新数据集，确保其内容的时效性和完整性。

背景与挑战

背景概述

Open TTS Tracker数据集由Vaibhavs10等人于2023年创建，旨在追踪所有开源文本到语音（TTS）模型的最新进展。该数据集为研究人员、开发者和爱好者提供了一个集中资源，帮助他们了解TTS领域的最新动态。数据集涵盖了多种开源TTS模型，包括AI4Bharat、Amphion、Bark等，每个模型都提供了GitHub链接、权重、许可证、微调信息、支持语言、论文和演示等详细信息。Open TTS Tracker的创建不仅推动了TTS技术的开源化，还为相关领域的研究提供了宝贵的参考和工具。

当前挑战

Open TTS Tracker数据集在构建和应用过程中面临多重挑战。首先，TTS技术本身在语音自然度、多语言支持和情感表达等方面存在技术瓶颈，如何提升模型的语音生成质量是一个核心问题。其次，数据集的构建需要不断追踪和整合最新的开源模型，确保信息的及时性和准确性，这对维护团队提出了较高的要求。此外，不同模型的许可证和开源协议差异较大，如何在合法合规的前提下整合这些资源也是一个复杂的法律问题。最后，如何评估和比较不同模型的性能，尤其是在多语言和情感控制等复杂场景下的表现，仍然是一个开放的研究课题。

常用场景

经典使用场景

Open TTS Tracker数据集作为文本到语音（TTS）领域的资源库，广泛应用于跟踪和比较开源TTS模型。研究人员和开发者通过该数据集能够快速获取最新的TTS模型信息，并进行模型性能的对比与评估。数据集中的模型涵盖了多种语言和功能，支持从基础语音合成到情感控制、语音克隆等高级应用，为TTS领域的研究提供了丰富的实验素材。

解决学术问题

Open TTS Tracker数据集解决了TTS领域中的模型信息分散和更新不及时的问题。通过集中展示开源TTS模型的详细信息，该数据集为研究人员提供了便捷的参考工具，帮助他们快速了解最新技术进展。此外，数据集中的模型对比功能为学术研究提供了实验基础，推动了TTS技术在语音质量、多语言支持、情感表达等方面的创新与优化。

实际应用

在实际应用中，Open TTS Tracker数据集为开发者提供了丰富的TTS模型选择，广泛应用于语音助手、有声读物、语音翻译等场景。通过数据集中的模型信息，开发者能够根据需求选择合适的TTS模型，并快速集成到实际项目中。此外，数据集中的模型对比功能也为企业提供了技术选型的参考，帮助其在语音合成领域保持竞争力。

数据集最近研究