five

Galgame语音文本数据集|游戏语音数据集|语音合成数据集

收藏
github2024-06-17 更新2024-06-19 收录
游戏语音
语音合成
下载链接:
https://github.com/KitsuneX07/Dataset_Maker_for_Galgames
下载链接
链接失效反馈
资源简介:
该数据集包含从Galgame游戏中提取的人物语音和对应的文本,用于支持SVC/TTS项目的开发。数据集通过特定的脚本和方法进行处理,以确保语音和文本的质量,适用于语音合成技术的研究和应用。

This dataset comprises character voices and corresponding texts extracted from Galgame games, designed to support the development of SVC/TTS projects. The dataset has been processed using specific scripts and methods to ensure the quality of both voice and text, making it suitable for research and application in speech synthesis technology.
创建时间:
2024-06-16
原始信息汇总

数据集概述

数据集用途

本数据集用于从Galgame中提取人物语音和对应文本,以支持SVC/TTS项目的开发。

数据集内容

  1. 语音文件:提取自Galgame的语音数据。
  2. 文本文件:与语音对应的文本数据。
  3. 标注文件:用于TTS项目的标注文件,包括.list.lab文件。

数据集处理工具

  1. Text_Cleaner.py:用于清理文本中的特殊字符,并筛选去除不适合作为数据集的文本。
  2. Dataset_Maker_for_Bert_VITS2.py:用于制作Bert_VITS2项目的数据集,包括复制音频文件、转换为.wav格式并重采样,以及创建标注文件。
  3. Dataset_Maker_for_GPT_Sovits.py:用于制作GPT_Sovits项目的数据集,功能与Bert_VITS2脚本类似,但标注文件结构有所不同。
  4. Dataset_Maker_for_Fish_Speech.py:用于制作Fish_Speech项目的数据集,包括复制音频文件、转换为.wav格式并重采样,以及创建标注文件。

数据集使用要求

  1. 基础计算机操作能力:如解压文件、运行Python文件。
  2. 基础计算机知识:如文件夹、文件、路径、终端。
  3. 搜索引擎使用能力:合理使用搜索引擎获取必要信息。
  4. 基础代码阅读能力:理解并操作相关脚本。
  5. 基础英语阅读能力:或使用翻译网站。

数据集结构

根据不同的游戏引擎进行分类,通用脚本放置在根目录下。每个脚本均包含详细的注释和使用说明。

AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于从Galgame中提取的人物语音及其对应的文本。通过特定的解包工具,从游戏文件中提取出音频文件和相应的文本信息,并将其格式化为JSON文件。随后,利用`Text_Cleaner.py`脚本对文本进行清洗,去除特殊字符和不适当的文本内容。接着,`Dataset_Maker.py`脚本将音频文件转换为.wav格式,并重采样至44100hz,同时生成对应的.lab标注文件。这一过程确保了数据集的规范性和适用性,为后续的SVC和TTS项目提供了高质量的训练数据。
使用方法
使用该数据集时,用户需具备基础的计算机操作能力和代码阅读能力。首先,通过解包工具提取游戏中的音频和文本信息,并将其格式化为JSON文件。接着,运行`Text_Cleaner.py`脚本对文本进行清洗,然后使用`Dataset_Maker.py`脚本处理音频文件并生成标注文件。最后,利用`List_Generator.py`脚本生成训练模型所需的列表文件。这些步骤确保了数据集的正确处理和高效利用,为SVC和TTS项目的开发提供了坚实的基础。
背景与挑战
背景概述
Galgame语音文本数据集是由KitsuneX07创建的,旨在为语音合成(SVC/TTS)项目提供高质量的数据集。该数据集的核心研究问题是从Galgame中提取人物语音和对应文本,以支持语音合成技术的研究与应用。创建时间不详,但该项目已在GitHub上公开,显示出其在语音合成领域的潜在影响力。通过提取和整理Galgame中的语音和文本,该数据集为研究人员提供了一个独特的资源,有助于推动语音合成技术的发展。
当前挑战
Galgame语音文本数据集在构建过程中面临多项挑战。首先,提取语音和文本的过程需要对不同游戏引擎的封包方式有深入了解,这增加了数据处理的复杂性。其次,文本清理和筛选过程中需要去除特殊字符和不适合的文本,确保数据集的质量。此外,由于文件体积限制,音频文件不直接提供,用户需自行解包,这要求用户具备一定的技术能力。最后,数据集的多样性和覆盖范围也是一个挑战,需要不断更新和扩展以适应不同研究需求。
常用场景
经典使用场景
Galgame语音文本数据集的经典使用场景主要集中在语音合成(TTS)和语音转换(SVC)项目中。通过提取Galgame中的人物语音及其对应的文本,该数据集为研究人员和开发者提供了一个丰富的资源库,用于训练和优化语音合成模型。这些模型能够生成高质量的语音,并能够模拟不同角色的语音特征,从而在虚拟角色对话、游戏配音等领域展现出巨大的应用潜力。
解决学术问题
该数据集解决了语音合成领域中数据稀缺和多样性不足的问题。传统的语音数据集往往缺乏情感表达和角色个性化的语音样本,而Galgame语音文本数据集通过提供大量带有情感和角色特征的语音样本,填补了这一空白。这不仅有助于提升语音合成模型的自然度和逼真度,还为研究情感计算和个性化语音合成提供了宝贵的数据支持。
实际应用
在实际应用中,Galgame语音文本数据集被广泛用于游戏开发、虚拟助手和教育工具等领域。例如,游戏开发者可以利用该数据集训练语音合成模型,为游戏角色赋予独特的语音特征,增强游戏的沉浸感。此外,虚拟助手和教育工具也可以通过使用该数据集,提供更加自然和个性化的语音交互体验,从而提升用户满意度。
数据集最近研究
最新研究方向
在Galgame语音文本数据集的前沿研究中,研究者们正致力于开发和优化语音合成(TTS)和语音转换(SVC)技术。这些技术不仅提升了游戏角色的语音表现力,还为虚拟角色的个性化语音生成提供了新的可能性。通过精细的文本清理和标注,研究者们能够更准确地捕捉和再现游戏角色的语音特征,从而推动了虚拟角色语音合成的技术进步。此外,结合大语言模型如GPT-4,这些研究进一步提升了数据处理的效率和准确性,为未来的语音合成项目奠定了坚实的基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。

www.nrel.gov 收录