hanamizuki-ai/genshin-voice-v3.5-mandarin

Name: hanamizuki-ai/genshin-voice-v3.5-mandarin
Creator: hanamizuki-ai
Published: 2023-04-13 14:47:16
License: 暂无描述

Hugging Face2023-04-13 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/hanamizuki-ai/genshin-voice-v3.5-mandarin

下载链接

链接失效反馈

官方服务：

资源简介：

Genshin Voice数据集是一个从游戏《原神》中提取的文本到语音数据集，包含不同角色的语音数据，文本为普通话。数据集包含游戏内的官方注释，如说话者姓名和转录文本。

The Genshin Voice Dataset is a text-to-speech dataset extracted from the game Genshin Impact. It contains voice data of various characters, with the accompanying text in Mandarin. The dataset also includes official in-game annotations such as speaker names and transcribed text.

提供机构：

hanamizuki-ai

原始信息汇总

Genshin Voice 数据集概述

数据集描述

数据集摘要

Genshin Voice 数据集是一个文本到语音的数据集，包含不同《原神》游戏角色的语音数据，这些数据是从游戏中提取出来的。

语言

数据集中的文本语言为普通话。

数据集特征

音频 (audio)：音频数据类型。
语言 (language)：字符串数据类型，表示语言。
角色名称 (npcName)：字符串数据类型，表示游戏中的角色名称。
文本 (text)：字符串数据类型，包含游戏中的对话文本。
类型 (type)：字符串数据类型，可能表示语音类型或其他相关信息。

数据集划分

训练集 (train)：
- 数据量：67921个样本
- 存储大小：33310846721.498字节
- 下载大小：17251924784字节

数据集创建

源数据

数据来源于《原神》游戏的解包数据。

语言生产者

语言生产者为Hoyoverse公司的员工及EchoSky Studio的承包商。

标注

数据集包含游戏中的官方标注，包括游戏内说话者名称和文本转录。

搜集汇总

数据集介绍

构建方式

汉化语音数据集Genshin Voice的构建，源于对《原神》游戏资源的解包，包含了不同角色的语音数据。数据集中语音的获取，经过了初始数据收集和规范化处理，由游戏公司Hoyoverse的员工及EchoSky Studio的外包承包商提供原始语言素材。该数据集进一步包含了游戏官方的标注信息，如角色名称和语音字幕。

特点

该数据集为单语言数据集，文本内容均为普通话。其特色在于，它提供了丰富的角色语音样本，可用于文本到语音的转换及自动语音识别任务。数据集的结构化特征包括音频文件、语言种类、角色名称、文本内容以及类型，这些信息为研究者和开发者提供了极大的便利。此外，数据集按照训练集进行了划分，包含了大量样本，确保了数据的多样性和可用性。

使用方法

使用Genshin Voice数据集时，用户需首先下载并解压数据集，之后可以根据数据集中的特征字段，例如音频和对应的文本字幕，进行语音合成或识别的相关研究。数据集的规模较大，用户在使用时需注意其对计算资源的需求。同时，使用数据集时还需遵守版权信息，尊重数据提供者的知识产权。

背景与挑战

背景概述

Genshin Voice数据集，一种基于《原神》游戏角色的文本转语音数据集，由开发者w4123基于游戏内容进行解包和整理而创建。该数据集主要涵盖普通话语音，旨在为文本到语音转换技术提供丰富的游戏角色语音样本。其创建时间为数据集首次在GitHub上公布之时，主要研究人员为w4123，数据源来自于游戏公司Hoyoverse及其合作伙伴EchoSky Studio。Genshin Voice数据集对语音合成领域，尤其是游戏角色语音的生成，产生了显著影响，为相关研究提供了宝贵的资源。

当前挑战

Genshin Voice数据集在构建过程中遇到的挑战主要包括：如何高效地从游戏中提取高质量的语音数据，并确保数据的多样性和准确性；如何处理和标注游戏中复杂的角色语音特征，以适应不同的文本转语音任务需求。此外，数据集在解决文本转语音领域问题，如语音的自然度、情感的传达等方面，仍面临如何进一步提高数据集质量和适用性的挑战。

常用场景

经典使用场景

在语音合成研究领域，hanamizuki-ai/genshin-voice-v3.5-mandarin数据集以其源自热门游戏《原神》的丰富语音资源，成为文本到语音转换任务的重要基准。该数据集包含不同角色的大量语音样本，能够辅助研究者探索更加自然、个性化的语音合成技术。

衍生相关工作

基于此数据集，研究者们已经开展了一系列相关工作，如语音转换、风格迁移、情感表达等领域的探索，这些研究进一步拓宽了语音合成技术的应用范围，为语音信息处理领域带来了新的研究视角和技术突破。

数据集最近研究