five

fgo_voices_jp

收藏
Hugging Face2024-08-28 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/deepghs/fgo_voices_jp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个针对FGO(命运/冠位指定)游戏中可玩角色的日语音频-文本数据集。数据集包含30800条记录,总计66.4小时,平均每条记录时长约为7.76秒。数据集的目的是用于微调或评估自动语音识别(ASR)和自动说话人验证(ASV)模型。为了减少数据集的噪声,只保留了由单一配音演员录制的语音。数据集中的每条记录包括角色ID、配音演员名称、语音标题、语音文本、时长、采样率、文件大小、文件名、MIME类型和文件URL等信息。

This dataset is a Japanese audio-text dataset for playable characters in the game Fate/Grand Order (FGO). It contains 30,800 records, totaling 66.4 hours, with an average duration of approximately 7.76 seconds per record. The purpose of this dataset is to fine-tune or evaluate Automatic Speech Recognition (ASR) and Automatic Speaker Verification (ASV) models. To reduce dataset noise, only speech recorded by a single voice actor is retained. Each record in the dataset includes information such as character ID, voice actor name, speech title, speech text, duration, sampling rate, file size, file name, MIME type, and file URL.
创建时间:
2024-08-28
原始信息汇总

JP Voice-Text Dataset for FGO Waifus

概述

该数据集包含《FGO》游戏中可玩角色的日语音频和对应文本,适用于自动语音识别(ASR)和音频分类任务的微调或评估。数据集中的音频均为单一配音演员录制,以减少数据集的噪声。

数据集详情

  • 语言: 日语
  • 标签: 音频, 文本, 语音, 动漫, FGO
  • 任务类别: 自动语音识别, 音频分类
  • 数据量: 30800条记录,总时长66.4小时,平均每条记录时长约7.76秒
  • 文件格式: MP3
  • 样本率: 44100 Hz

数据结构

数据集包含以下字段:

  • id: 记录唯一标识
  • char_id: 角色ID
  • voice_actor_name: 配音演员名称
  • voice_title: 语音标题
  • voice_text: 语音对应的文本
  • time: 音频时长
  • sample_rate: 采样率
  • file_size: 文件大小
  • filename: 文件名
  • mimetype: 文件类型
  • file_url: 文件下载链接

示例数据

id char_id voice_actor_name voice_title voice_text time sample_rate file_size filename mimetype file_url
char_1_SV1_0_对话12 1 高桥李依 对话 12 いよいよ、大西洋のロストベルト……最大の空想樹との対決です。キリシュタリア・ヴォーダイム——クリプターのリーダーである彼を無力化すれば、この現象の解決法も、見えてくるはず…… 17.5648 44100 180947 char_1_SV1_0_对话12.mp3 audio/mpeg https://media.fgo.wiki/d/d0/SV1_0_%E5%AF%B9%E8%AF%9D12.mp3
char_1_SV1_0_对话13 1 高桥李依 对话 13 いよいよ、オリュンポスに上陸ですね。でも……私はまだ、サーヴァントとしての霊基を発揮できてはいません。クリプター、ロストベルト……歴史に排斥された敗者たち。私たちの正義は、彼らにとっては残酷な特権でした。私は、彼らから未来を奪う以上、ちゃんと自分の結論を持たないといけないのに…… 36.112 44100 347692 char_1_SV1_0_对话13.mp3 audio/mpeg https://media.fgo.wiki/b/b8/SV1_0_%E5%AF%B9%E8%AF%9D13.mp3
char_1_SV1_0_对话14 1 高桥李依 对话 14 最大の空想樹は消滅しました。ですが、今度はオルガマリー所長が……私たちが知っている所長ではないようでしたが。キリシュタリアさんの助けで生還できたものの、もし次にあの神と遭遇した時、私たちは戦えるのでしょうか……? 24.763 44100 177056 char_1_SV1_0_对话14.mp3 audio/mpeg https://media.fgo.wiki/7/78/SV1_0_%E5%AF%B9%E8%AF%9D14.mp3

许可

该数据集的许可类型为“其他”。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集专注于《Fate/Grand Order》游戏中可玩角色的日语语音与文本对应关系。为确保数据的纯净性,仅保留了由单一配音演员演绎的语音片段,避免了多配音演员带来的噪声干扰。数据集共包含30800条记录,总时长达66.4小时,平均每条语音时长约为7.76秒。每条记录均详细标注了角色ID、配音演员姓名、语音标题、语音文本、时长、采样率、文件大小及文件URL等信息,确保了数据的完整性与可追溯性。
特点
该数据集的特点在于其高度结构化的语音-文本对应关系,适用于自动语音识别(ASR)和语音分类(ASV)模型的微调与评估。数据集中所有语音均来自《Fate/Grand Order》游戏中的角色对话、攻击、技能、宝具等场景,涵盖了丰富的语音类型与情感表达。此外,数据集的语音文本经过严格校对,确保了文本与语音的高度一致性,为语音识别任务提供了高质量的标注数据。
使用方法
该数据集的使用方法主要围绕语音识别与语音分类任务展开。研究人员可通过下载数据集中的语音文件及其对应的文本标注,构建训练集与测试集,用于训练或评估ASR/ASV模型。由于数据集中的语音类型多样,用户可根据具体需求选择特定类型的语音进行实验,例如专注于角色对话或战斗场景的语音识别。此外,数据集的详细标注信息也为进一步的数据分析与模型优化提供了便利。
背景与挑战
背景概述
fgo_voices_jp数据集是一个专注于《Fate/Grand Order》(FGO)游戏中可玩角色日语语音与文本的语料库。该数据集由FGO社区成员构建,旨在为自动语音识别(ASR)和音频分类模型提供高质量的微调和评估数据。数据集收录了30800条语音记录,总时长约66.4小时,平均每条语音时长为7.76秒。其核心研究问题在于如何通过高质量的语音-文本对,提升ASR模型在特定领域(如动漫游戏语音)的识别精度。该数据集不仅为语音技术研究提供了宝贵的资源,还推动了二次元文化相关技术的应用与发展。
当前挑战
fgo_voices_jp数据集在构建和应用中面临多重挑战。首先,语音识别领域的主要挑战在于如何准确捕捉并转录游戏角色的多样化语音表达,尤其是面对语速变化、情感波动以及特定游戏术语的复杂性。其次,数据集的构建过程中,需确保语音与文本的严格对齐,并排除多声优混杂的噪声数据,这对数据清洗和标注提出了较高要求。此外,由于语音数据来源于游戏场景,背景音效和混响可能对语音识别的准确性造成干扰,进一步增加了模型训练的难度。这些挑战不仅考验了数据集的构建质量,也对后续的模型优化提出了更高的技术需求。
常用场景
经典使用场景
fgo_voices_jp数据集在自动语音识别(ASR)和音频分类任务中具有广泛的应用。该数据集包含了《Fate/Grand Order》游戏中角色的日语语音及其对应的文本,适用于模型的微调和评估。通过提供高质量的语音-文本对,该数据集能够帮助研究人员开发更精确的语音识别系统,尤其是在处理动漫或游戏相关的语音数据时,表现出色。
实际应用
在实际应用中,fgo_voices_jp数据集可用于开发游戏语音助手、角色语音生成系统以及语音驱动的游戏互动功能。例如,游戏开发者可以利用该数据集训练语音识别模型,实现玩家与游戏角色的语音交互,提升游戏的沉浸感和用户体验。此外,该数据集还可用于语音合成技术的研究,生成更加自然和逼真的角色语音。
衍生相关工作
基于fgo_voices_jp数据集,许多经典的研究工作得以展开。例如,研究人员利用该数据集开发了针对动漫语音的专用语音识别模型,显著提升了识别准确率。此外,该数据集还被用于语音情感分析的研究,帮助识别和分类角色语音中的情感特征。这些工作不仅推动了语音识别技术的发展,也为动漫和游戏领域的语音应用提供了新的可能性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作