hanamizuki-ai/genshin-voice-v3.5-mandarin
收藏Hugging Face2023-04-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hanamizuki-ai/genshin-voice-v3.5-mandarin
下载链接
链接失效反馈官方服务:
资源简介:
Genshin Voice数据集是一个从游戏《原神》中提取的文本到语音数据集,包含不同角色的语音数据,文本为普通话。数据集包含游戏内的官方注释,如说话者姓名和转录文本。
The Genshin Voice Dataset is a text-to-speech dataset extracted from the game Genshin Impact. It contains voice data of various characters, with the accompanying text in Mandarin. The dataset also includes official in-game annotations such as speaker names and transcribed text.
提供机构:
hanamizuki-ai
原始信息汇总
Genshin Voice 数据集概述
数据集描述
数据集摘要
Genshin Voice 数据集是一个文本到语音的数据集,包含不同《原神》游戏角色的语音数据,这些数据是从游戏中提取出来的。
语言
数据集中的文本语言为普通话。
数据集特征
- 音频 (audio):音频数据类型。
- 语言 (language):字符串数据类型,表示语言。
- 角色名称 (npcName):字符串数据类型,表示游戏中的角色名称。
- 文本 (text):字符串数据类型,包含游戏中的对话文本。
- 类型 (type):字符串数据类型,可能表示语音类型或其他相关信息。
数据集划分
- 训练集 (train):
- 数据量:67921个样本
- 存储大小:33310846721.498字节
- 下载大小:17251924784字节
数据集创建
源数据
数据来源于《原神》游戏的解包数据。
语言生产者
语言生产者为Hoyoverse公司的员工及EchoSky Studio的承包商。
标注
数据集包含游戏中的官方标注,包括游戏内说话者名称和文本转录。
搜集汇总
数据集介绍

构建方式
汉化语音数据集Genshin Voice的构建,源于对《原神》游戏资源的解包,包含了不同角色的语音数据。数据集中语音的获取,经过了初始数据收集和规范化处理,由游戏公司Hoyoverse的员工及EchoSky Studio的外包承包商提供原始语言素材。该数据集进一步包含了游戏官方的标注信息,如角色名称和语音字幕。
特点
该数据集为单语言数据集,文本内容均为普通话。其特色在于,它提供了丰富的角色语音样本,可用于文本到语音的转换及自动语音识别任务。数据集的结构化特征包括音频文件、语言种类、角色名称、文本内容以及类型,这些信息为研究者和开发者提供了极大的便利。此外,数据集按照训练集进行了划分,包含了大量样本,确保了数据的多样性和可用性。
使用方法
使用Genshin Voice数据集时,用户需首先下载并解压数据集,之后可以根据数据集中的特征字段,例如音频和对应的文本字幕,进行语音合成或识别的相关研究。数据集的规模较大,用户在使用时需注意其对计算资源的需求。同时,使用数据集时还需遵守版权信息,尊重数据提供者的知识产权。
背景与挑战
背景概述
Genshin Voice数据集,一种基于《原神》游戏角色的文本转语音数据集,由开发者w4123基于游戏内容进行解包和整理而创建。该数据集主要涵盖普通话语音,旨在为文本到语音转换技术提供丰富的游戏角色语音样本。其创建时间为数据集首次在GitHub上公布之时,主要研究人员为w4123,数据源来自于游戏公司Hoyoverse及其合作伙伴EchoSky Studio。Genshin Voice数据集对语音合成领域,尤其是游戏角色语音的生成,产生了显著影响,为相关研究提供了宝贵的资源。
当前挑战
Genshin Voice数据集在构建过程中遇到的挑战主要包括:如何高效地从游戏中提取高质量的语音数据,并确保数据的多样性和准确性;如何处理和标注游戏中复杂的角色语音特征,以适应不同的文本转语音任务需求。此外,数据集在解决文本转语音领域问题,如语音的自然度、情感的传达等方面,仍面临如何进一步提高数据集质量和适用性的挑战。
常用场景
经典使用场景
在语音合成研究领域,hanamizuki-ai/genshin-voice-v3.5-mandarin数据集以其源自热门游戏《原神》的丰富语音资源,成为文本到语音转换任务的重要基准。该数据集包含不同角色的大量语音样本,能够辅助研究者探索更加自然、个性化的语音合成技术。
衍生相关工作
基于此数据集,研究者们已经开展了一系列相关工作,如语音转换、风格迁移、情感表达等领域的探索,这些研究进一步拓宽了语音合成技术的应用范围,为语音信息处理领域带来了新的研究视角和技术突破。
数据集最近研究
最新研究方向
在语音合成与识别领域,Genshin Voice数据集以其源自热门游戏《原神》的语音样本而备受瞩目。近期研究集中于深度学习模型的优化,旨在提升文本到语音的转换质量和自动语音识别的准确度。该数据集涵盖了丰富的角色语音,为研究个性化语音合成和情感表达提供了宝贵资源。其在本领域的前沿研究方向包括利用深度学习技术进行语音风格迁移、多语言语音合成以及基于情感的语音生成。这些研究不仅推动了语音技术的商业应用,如语音助手和游戏角色的语音定制,同时也为语音识别在噪声环境下的鲁棒性提供了新的解决思路,具有重要的研究价值和实际意义。
以上内容由遇见数据集搜集并总结生成



