Galgame语音文本数据集

github2024-06-17 更新2024-06-19 收录

下载链接：

https://github.com/KitsuneX07/Dataset_Maker_for_Galgames

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含从Galgame游戏中提取的人物语音和对应的文本，用于支持SVC/TTS项目的开发。数据集通过特定的脚本和方法进行处理，以确保语音和文本的质量，适用于语音合成技术的研究和应用。

This dataset comprises character voices and corresponding texts extracted from Galgame games, designed to support the development of SVC/TTS projects. The dataset has been processed using specific scripts and methods to ensure the quality of both voice and text, making it suitable for research and application in speech synthesis technology.

创建时间：

2024-06-16

原始信息汇总

数据集概述

数据集用途

本数据集用于从Galgame中提取人物语音和对应文本，以支持SVC/TTS项目的开发。

数据集内容

语音文件：提取自Galgame的语音数据。
文本文件：与语音对应的文本数据。
标注文件：用于TTS项目的标注文件，包括.list和.lab文件。

数据集处理工具

Text_Cleaner.py：用于清理文本中的特殊字符，并筛选去除不适合作为数据集的文本。
Dataset_Maker_for_Bert_VITS2.py：用于制作Bert_VITS2项目的数据集，包括复制音频文件、转换为.wav格式并重采样，以及创建标注文件。
Dataset_Maker_for_GPT_Sovits.py：用于制作GPT_Sovits项目的数据集，功能与Bert_VITS2脚本类似，但标注文件结构有所不同。
Dataset_Maker_for_Fish_Speech.py：用于制作Fish_Speech项目的数据集，包括复制音频文件、转换为.wav格式并重采样，以及创建标注文件。

数据集使用要求

基础计算机操作能力：如解压文件、运行Python文件。
基础计算机知识：如文件夹、文件、路径、终端。
搜索引擎使用能力：合理使用搜索引擎获取必要信息。
基础代码阅读能力：理解并操作相关脚本。
基础英语阅读能力：或使用翻译网站。

数据集结构

根据不同的游戏引擎进行分类，通用脚本放置在根目录下。每个脚本均包含详细的注释和使用说明。

搜集汇总

数据集介绍

构建方式

该数据集的构建基于从Galgame中提取的人物语音及其对应的文本。通过特定的解包工具，从游戏文件中提取出音频文件和相应的文本信息，并将其格式化为JSON文件。随后，利用`Text_Cleaner.py`脚本对文本进行清洗，去除特殊字符和不适当的文本内容。接着，`Dataset_Maker.py`脚本将音频文件转换为.wav格式，并重采样至44100hz，同时生成对应的.lab标注文件。这一过程确保了数据集的规范性和适用性，为后续的SVC和TTS项目提供了高质量的训练数据。

使用方法

使用该数据集时，用户需具备基础的计算机操作能力和代码阅读能力。首先，通过解包工具提取游戏中的音频和文本信息，并将其格式化为JSON文件。接着，运行`Text_Cleaner.py`脚本对文本进行清洗，然后使用`Dataset_Maker.py`脚本处理音频文件并生成标注文件。最后，利用`List_Generator.py`脚本生成训练模型所需的列表文件。这些步骤确保了数据集的正确处理和高效利用，为SVC和TTS项目的开发提供了坚实的基础。

背景与挑战

背景概述

Galgame语音文本数据集是由KitsuneX07创建的，旨在为语音合成（SVC/TTS）项目提供高质量的数据集。该数据集的核心研究问题是从Galgame中提取人物语音和对应文本，以支持语音合成技术的研究与应用。创建时间不详，但该项目已在GitHub上公开，显示出其在语音合成领域的潜在影响力。通过提取和整理Galgame中的语音和文本，该数据集为研究人员提供了一个独特的资源，有助于推动语音合成技术的发展。

当前挑战

Galgame语音文本数据集在构建过程中面临多项挑战。首先，提取语音和文本的过程需要对不同游戏引擎的封包方式有深入了解，这增加了数据处理的复杂性。其次，文本清理和筛选过程中需要去除特殊字符和不适合的文本，确保数据集的质量。此外，由于文件体积限制，音频文件不直接提供，用户需自行解包，这要求用户具备一定的技术能力。最后，数据集的多样性和覆盖范围也是一个挑战，需要不断更新和扩展以适应不同研究需求。

常用场景

经典使用场景

Galgame语音文本数据集的经典使用场景主要集中在语音合成（TTS）和语音转换（SVC）项目中。通过提取Galgame中的人物语音及其对应的文本，该数据集为研究人员和开发者提供了一个丰富的资源库，用于训练和优化语音合成模型。这些模型能够生成高质量的语音，并能够模拟不同角色的语音特征，从而在虚拟角色对话、游戏配音等领域展现出巨大的应用潜力。

解决学术问题

该数据集解决了语音合成领域中数据稀缺和多样性不足的问题。传统的语音数据集往往缺乏情感表达和角色个性化的语音样本，而Galgame语音文本数据集通过提供大量带有情感和角色特征的语音样本，填补了这一空白。这不仅有助于提升语音合成模型的自然度和逼真度，还为研究情感计算和个性化语音合成提供了宝贵的数据支持。

实际应用

在实际应用中，Galgame语音文本数据集被广泛用于游戏开发、虚拟助手和教育工具等领域。例如，游戏开发者可以利用该数据集训练语音合成模型，为游戏角色赋予独特的语音特征，增强游戏的沉浸感。此外，虚拟助手和教育工具也可以通过使用该数据集，提供更加自然和个性化的语音交互体验，从而提升用户满意度。

数据集最近研究