TTS_Arena

Hugging Face2024-10-14 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/Pendrokar/TTS_Arena

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个SQLite数据库文件，包含与文本到语音（TTS）模型相关的投票和评价信息。数据集记录了语音文本、语言、被选择的模型、被拒绝的模型、投票次数和最后投票时间等信息。

创建时间：

2024-10-12

原始信息汇总

TTS_Arena 数据集概述

语言

英语 (en)

数据库类型

SQLite 数据库文件

查询示例

所有提及特定 TTS 模型的投票

sql SELECT spokentext, lang, chosen, rejected, count(spokentext) AS times, MAX(vl.timestamp) AS lastvote FROM "main"."spokentext" INNER JOIN votelog vl ON votelog_id = vl.id WHERE vl.chosen = "Pendrokar/xVASynth-TTS" OR vl.rejected = "Pendrokar/xVASynth-TTS" GROUP BY spokentext, chosen, rejected ORDER BY times DESC, spokentext ASC LIMIT 0, 49999;

特定 TTS 模型与其他模型的所有拒绝情况

sql SELECT spokentext, lang, chosen, rejected, count(spokentext) AS times, MAX(vl.timestamp) AS lastvote FROM "main"."spokentext" INNER JOIN votelog vl ON votelog_id = vl.id AND vl.rejected = "Pendrokar/xVASynth-TTS" GROUP BY spokentext, chosen ORDER BY spokentext ASC LIMIT 0, 49999;

引用信息

bibtext @misc{tts-arena, title = {Text to Speech Arena - Pendrokars HF Spaces Fork}, author = {mrfakename and Srivastav, Vaibhav and Fourrier, Clémentine and Pouget, Lucain and Lacombe, Yoach and main and Gandhi, Sanchit}, year = 2024, publisher = {Hugging Face}, howpublished = "\url{https://huggingface.co/spaces/TTS-AGI/TTS-Arena}" }

搜集汇总

数据集介绍

构建方式

TTS_Arena数据集的构建基于SQLlite数据库文件，旨在为TTS开发者提供模型评估的参考数据。数据集通过记录用户对不同TTS模型的选择和拒绝行为，生成了详细的投票日志。这些日志包含了用户对特定TTS模型的偏好信息，并通过SQL查询语句进行结构化存储，便于开发者进行深入分析。

特点

TTS_Arena数据集的特点在于其专注于TTS模型的用户偏好评估，提供了丰富的投票数据。数据集不仅记录了用户选择的模型，还详细记录了被拒绝的模型及其对应的文本内容。通过SQL查询，开发者可以快速获取特定模型的投票情况、被拒绝的频率以及与其他模型的对比数据。这种结构化的数据形式为模型优化提供了有力的支持。

使用方法

TTS_Arena数据集的使用方法主要依赖于SQL查询语句。开发者可以通过预定义的SQL查询语句，获取特定TTS模型的投票数据、被拒绝情况以及与其他模型的对比信息。这些查询语句可以直接在SQLlite数据库中执行，帮助开发者快速分析模型的性能表现。此外，数据集还提供了时间戳信息，便于开发者进行时间维度的分析。

背景与挑战

背景概述

TTS_Arena数据集由mrfakename、Vaibhav Srivastav、Clémentine Fourrier、Lucain Pouget、Yoach Lacombe、Sanchit Gandhi等研究人员于2024年发布，旨在为文本到语音（TTS）开发者提供一个评估模型性能的平台。该数据集基于SQLite数据库，包含了用户对不同TTS模型的投票记录，帮助开发者识别模型在生成语音时的缺陷。TTS_Arena的创建反映了对TTS技术质量评估的迫切需求，尤其是在多语言和多样化语音生成场景中。该数据集通过公开投票数据，促进了TTS技术的透明度和改进，对语音合成领域的研究与实践具有重要影响。

当前挑战

TTS_Arena数据集在解决TTS模型评估问题时面临多重挑战。首先，数据集的核心目标是帮助开发者识别模型生成语音的缺陷，但由于语音生成的主观性和多样性，如何设计有效的评估指标成为一大难题。其次，数据集的构建过程中，研究人员需确保用户投票数据的准确性和代表性，同时避免恶意或不相关的投票干扰。此外，由于语音生成可能涉及敏感内容，数据集在公开音频样本时面临安全风险，研究人员不得不采用自动语音识别（ASR）模型进行过滤，但仍难以完全避免不适当内容的出现。这些挑战凸显了TTS技术评估的复杂性和数据集构建的高标准要求。

常用场景

经典使用场景

TTS_Arena数据集在文本到语音（TTS）模型的开发与评估中扮演着关键角色。开发者通过该数据集提供的SQL查询功能，能够深入分析不同TTS模型在语音生成任务中的表现，特别是在语音质量、自然度及语言适应性等方面的对比。数据集中的投票记录和模型选择结果，为开发者提供了宝贵的反馈，帮助他们优化模型性能。

解决学术问题

TTS_Arena数据集有效解决了TTS模型评估中的标准化问题。通过提供结构化的投票数据和模型对比结果，研究者能够客观评估不同模型在生成语音时的优劣。这不仅为学术研究提供了可靠的数据支持，还推动了TTS技术在实际应用中的进步，特别是在多语言支持和语音自然度提升方面。

衍生相关工作

TTS_Arena数据集催生了一系列相关研究工作，特别是在TTS模型优化和多语言语音合成领域。基于该数据集的研究成果，推动了诸如语音风格迁移、情感语音合成等前沿技术的发展。此外，数据集还为开源社区提供了丰富的实验数据，促进了TTS技术的共享与创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集