simon3000/starrail-voice
收藏Hugging Face2024-06-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/simon3000/starrail-voice
下载链接
链接失效反馈官方服务:
资源简介:
StarRail Voice数据集包含来自游戏《Honkai: Star Rail》的语音台词,支持多种语言(中文、英文、日文、韩文)。这些语音台词由游戏中的角色说出,涵盖了问候、战斗和故事对话等多种主题。数据集的特征包括音频文件、游戏内文件名、转录文本、语言、说话者和语音类型。数据集分为训练集,包含171,047个样本,总大小为91,463,616,840.128字节。数据集的创建过程涉及从游戏中解包数据,并包含官方的注释,如语言、说话者名称和转录文本。然而,部分语音台词缺少说话者名称和转录文本。数据集的使用者应注意这些限制和偏差。
The StarRail Voice dataset contains voice lines from the game Honkai: Star Rail, supporting multiple languages (Chinese, English, Japanese, Korean). These voice lines are spoken by characters in the game and cover a wide range of topics, including greetings, combat, and story dialogue. The dataset features include audio files, in-game filenames, transcriptions, language, speaker, and voice type. The dataset is divided into a training set containing 171,047 samples with a total size of 91,463,616,840.128 bytes. The dataset creation process involves unpacking data from the game and includes official annotations such as language, speaker names, and transcriptions. However, some voice lines are missing speaker names and transcriptions. Users of the dataset should be aware of these limitations and biases.
提供机构:
simon3000
原始信息汇总
StarRail Voice 数据集概述
数据集描述
StarRail Voice 是一个包含来自游戏《崩坏:星穹铁道》角色语音线的数据集,支持多种语言,包括中文、英语、日语和韩语。语音线涵盖了问候、战斗和故事对话等多种主题。
数据集结构
特征
- audio: 音频数据
- ingame_filename: 游戏内文件名
- transcription: 转录文本
- language: 语言
- speaker: 说话者
- voice_type: 语音类型
数据分割
- train: 训练集,包含 163522 条样本,总大小为 109814171674.772 字节
数据集大小
- 下载大小: 77257812544 字节
- 数据集大小: 109814171674.772 字节
数据集创建
数据来源
数据来源于《崩坏:星穹铁道》游戏的解包。
数据处理
详细的数据处理方法请参考 StarRail-Voice 和 bnnm/wwiser-utils#15。
数据生产者
数据生产者为游戏开发者 HoYoverse。
标注信息
数据集包含游戏官方提供的标注,包括语言、说话者名称和转录文本。
偏差、风险和限制
标注不完全,部分语音线缺失说话者名称和转录文本。
许可信息
版权所有 © COGNOSPHERE。保留所有权利。



