WutheringWaves_Datasets

github2024-07-14 更新2024-07-15 收录

下载链接：

https://github.com/AI-Hobbyist/WutheringWaves_Datasets

下载链接

链接失效反馈

官方服务：

资源简介：

本仓库包含用于SVC/SVS/TTS的语音数据集，所有权归库洛游戏所有。数据集仅供二次创作和模型训练，不得用于商业用途或违反法律法规的内容。

This repository contains a speech dataset for SVC, SVS and TTS tasks. All rights of this dataset are owned by Kuro Games. The dataset is exclusively permitted for secondary creation and model training, and shall not be used for commercial purposes or any content that violates laws and regulations.

创建时间：

2024-07-13

原始信息汇总

Wuthering Waves Datasets For SVC/SVS/TTS

注意事项

本仓库的语音数据集的所有权均归库洛游戏所有。
数据集仅供二次创作&模型训练，不得用于任何商业用途，不得用本仓库数据集训练的模型制作违反法律法规的内容，不得二次配布。如被发现滥用，将停止公开！
如果训练模型的时候用到了本仓库的数据集，欢迎各位在作品简介里面注明本仓库地址。
如果急需新版数据集，在新版数据集上传前可以通过分类脚本和索引自行分类。分类脚本获取：传送门

更新日志

日期	更新内容
2024.07.14	更新鸣潮1.1全角色语音完整包+单角色包+索引

当前游戏版本

	中文	日语	英语	韩语
语音索引	1.1	1.1	1.1	1.1
语音数据集(分角色包)	1.1	1.1	1.1	1.1
语音数据集(完整包)	1.1	1.1	1.1	1.1

数据集下载

	中文	日语	英语	韩语
分角色包	点我获取	点我获取	点我获取	点我获取
完整包	点我获取	点我获取	点我获取	点我获取
语音索引	点我获取	点我获取	点我获取	点我获取

数据集常用训练项目（欢迎补充）

名称	仓库
Vits	https://github.com/CjangCjengh/vits
Bert-Vits	https://github.com/fishaudio/Bert-VITS2
Sovits	https://github.com/svc-develop-team/so-vits-svc
Fish Diffusion	https://github.com/fishaudio/fish-diffusion
DDSP-SVC	https://github.com/yxlllc/DDSP-SVC
Diff-SVC	https://github.com/prophesier/diff-svc
RVC	https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI
GPT-Sovits	https://github.com/RVC-Boss/GPT-SoVITS
DiffSinger	https://github.com/openvpi/DiffSinger

搜集汇总

数据集介绍

构建方式

WutheringWaves_Datasets的构建基于多语言语音数据，涵盖了中文、日文、英文和韩文四种语言。数据集分为角色包和完整包两种类型，分别针对不同语言版本的游戏角色语音进行收集和整理。每个语言版本的数据集均包含1.4版本的语音数据，确保了数据的时效性和完整性。通过专业的语音采集和处理技术，确保了语音数据的高质量和多样性，为语音合成和语音识别等应用提供了丰富的资源。

特点

WutheringWaves_Datasets的主要特点在于其多语言覆盖和高质量的语音数据。数据集不仅包含了多种语言的语音样本，还提供了角色包和完整包两种下载选项，满足了不同用户的需求。此外，数据集的版本更新及时，确保了数据的最新状态。语音数据的多样性和高质量，使其在语音合成、语音识别和语音转换等领域具有广泛的应用潜力。

使用方法

使用WutheringWaves_Datasets时，用户可以根据需求选择下载角色包或完整包。角色包提供了特定语言版本的游戏角色语音数据，而完整包则包含了所有语言版本的语音数据。下载链接可通过提供的URL获取，支持wget命令进行快速下载。数据集适用于语音合成、语音识别和语音转换等领域的研究和应用，用户可根据具体需求进行数据处理和模型训练。

背景与挑战

背景概述

WutheringWaves_Datasets是由AI Hobbyist团队创建的一个多语言语音数据集，旨在支持语音合成（SVC/SVS/TTS）领域的研究。该数据集于2024年11月24日发布，包含了中文、日文、英文和韩文的多语言语音数据。其核心研究问题是如何在不同语言和文化背景下实现高质量的语音合成，这对于提升多语言语音合成技术的普适性和应用范围具有重要意义。WutheringWaves_Datasets的发布，为语音合成领域的研究人员提供了一个宝贵的资源，有助于推动该领域的发展和创新。

当前挑战

WutheringWaves_Datasets在构建过程中面临了多语言语音数据收集和处理的挑战。首先，不同语言的语音特征和文化背景差异巨大，如何确保数据集在各种语言中保持一致性和高质量是一个复杂的问题。其次，数据集的构建需要大量的时间和资源，尤其是在多语言环境下，数据标注和质量控制尤为困难。此外，如何确保数据集的多样性和代表性，以避免偏见和提高模型的泛化能力，也是该数据集面临的重要挑战。

常用场景

经典使用场景

在语音合成（TTS）、语音转换（SVC）和歌唱语音合成（SVS）领域，WutheringWaves_Datasets 数据集被广泛用于训练和评估模型。该数据集包含了多语言（中文、日文、英文和韩文）的角色语音包和完整语音包，为研究人员提供了丰富的语音资源。通过这些数据，研究者可以开发出能够生成高质量、自然语音的模型，从而在多个语言环境中实现高效的语音合成和转换。

衍生相关工作

基于 WutheringWaves_Datasets 数据集，研究者们开发了多种语音合成和转换模型，如基于深度学习的端到端语音合成系统、跨语言语音转换模型等。这些模型在多个国际语音合成挑战赛中取得了优异成绩，推动了语音合成技术的发展。此外，该数据集还激发了多语言语音数据集的构建和研究，促进了语音处理领域的跨语言研究和技术进步。

数据集最近研究