five

MomoyamaSawa/Voice-KusanagiNene

收藏
Hugging Face2024-01-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MomoyamaSawa/Voice-KusanagiNene
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: gpl-3.0 task_categories: - other - text-to-speech - audio-to-audio language: - ja tags: - pjsk - 草薙寧々 - 草薙宁宁 - プロセカ - prsk - 宁宁 pretty_name: 捏捏 size_categories: - 1K<n<10K --- <p align = 'center'> <img width='150' src='./README.assets/stamp0546.png'> </p> <p align = 'center'> 🥕 </p> <p align = 'center'> 如果兔兔的仓库对你有帮助的话点个⭐喵~ </p> <p align = 'center'> If Tutu's repository is helpful to you, please give it a ⭐ meow~ </p> <p align = 'center'> もしうさぎのリポジトリが役に立った場合は、⭐をぽちっとしてくださいにゃん~ </p> <p align = 'center'> 🍉 </p> <p align = 'center'> 任何 ❓问题 / 💭思考 /💡想法 都欢迎提出!</p> <p align = 'center'> Any ❓question / 💭thought /💡idea is welcome! </p> <p align = 'center'> どんな ❓質問 / 💭考え /💡アイデア でも歓迎です! </p> --- # 简介 * [草薙寧々](https://zh.moegirl.org.cn/%E8%8D%89%E8%96%99%E5%AE%81%E5%AE%81) 干声带标签数据集 本数据集只收集了游戏内的一部分,并不是全部的宁宁干声语音,其中 nene_org.txt 是标签文件 pjsk 全部角色干声带标签数据集的话可以加QQ群:691795641,群公告里有网盘地址 # 参考 * 声源归属:草薙寧々(CV:Machico)-[「プロジェクトセカイ カラフルステージ! feat. 初音ミク」](https://pjsekai.sega.jp/) # TODO * (长期)补全宁宁语音,规范数据集格式。

license: GPL-3.0 任务类别:其他、文本转语音、音频转音频 语言:日语 标签:pjsk、草薙宁宁(Nene Kusanagi)、草薙宁宁、プロセカ、prsk、宁宁 展示名称:捏捏 样本量范围:1000 < n < 10000 --- <p align='center'> <img width='150' src='./README.assets/stamp0546.png'> </p> <p align='center'> 🥕 </p> <p align='center'> 若兔兔的仓库对您有所帮助,敬请点亮⭐星标哦喵~ </p> <p align='center'> 若您认为本仓库具备参考价值,不妨为其点亮⭐星标哦喵~ </p> <p align='center'> 若您觉得本仓库有所助益,还请点亮⭐星标哦喵~ </p> <p align='center'> 🍉 </p> <p align='center'> 欢迎提出任何疑问、思考或创意想法!</p> <p align='center'> 欢迎提出任何疑问、思考或创意想法!</p> <p align='center'> 欢迎提出任何疑问、思考或创意想法!</p> --- # 简介 * [草薙宁宁(Nene Kusanagi)](https://zh.moegirl.org.cn/%E8%8D%89%E8%96%99%E5%AE%81%E5%AE%81) 干声语音标签数据集 本数据集仅收录了游戏内部分草薙宁宁的干声语音,并未覆盖全部内容,其中 `nene_org.txt` 为标签文件。 若需获取pjsk全角色干声语音标签数据集,可加入QQ群:691795641,群公告中包含网盘下载地址。 # 参考 * 声源所属:草薙宁宁(Nene Kusanagi,配音:Machico)-《世界计划 彩色舞台 feat. 初音未来》(プロジェクトセカイ カラフルステージ! feat. 初音ミク)[官方链接](https://pjsekai.sega.jp/) # 待办事项 * (长期规划)补全草薙宁宁的语音素材,规范数据集格式。
提供机构:
MomoyamaSawa
原始信息汇总

数据集概述

基本信息

  • 许可证:GPL-3.0
  • 任务类别
    • 其他
    • 文本转语音
    • 音频转音频
  • 语言:日语
  • 标签
    • pjsk
    • 草薙寧々
    • 草薙宁宁
    • プロセカ
    • prsk
    • 宁宁
  • 易读名称:捏捏
  • 数据集大小:1K<n<10K

简介

  • 内容:草薙寧々干声带标签数据集
  • 说明:本数据集只收集了游戏内的一部分,并不是全部的宁宁干声语音。其中 nene_org.txt 是标签文件。
  • 相关资源:pjsk 全部角色干声带标签数据集可加入QQ群:691795641,群公告中有网盘地址。

参考

TODO

  • 长期计划:补全宁宁语音,规范数据集格式。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集聚焦于日本多媒体企划《Project SEKAI》中角色草薙宁宁(CV: Machico)的游戏内干声语音,旨在为文本转语音与音频处理任务提供高质量标注资源。数据集的构建源自对游戏内语音的精心提取与筛选,仅收录角色在游戏中的部分干声片段,并未涵盖全部语音。所有音频均以原始干声形式保存,避免背景音乐或环境噪声的干扰,确保声学特征的纯净性。配套的标签文件nene_org.txt记录了每条语音的对应文本标注,为后续的声学模型训练与语音合成研究提供了清晰的映射关系。数据集规模介于1000至10000条之间,体现了对数据质量与可用性的平衡考量。
特点
本数据集的核心特色在于其专注于单一角色的语音资源,为角色定制化语音合成与声纹分析提供了精准的数据支撑。所有音频均源自官方游戏内容,保证了声源的真实性与一致性,且干声格式降低了预处理复杂度,可直接用于特征提取。标签文件以文本形式对齐语音内容,支持监督学习场景下的端到端模型训练。此外,数据集采用GPL-3.0开源协议发布,鼓励学术界与工业界在合规框架下自由使用与二次开发。其轻量级规模与明确的角色归属,使其成为小样本学习与个性化语音生成任务的理想选择。
使用方法
使用该数据集时,研究者可首先解压音频文件并读取nene_org.txt标签文件,建立音频路径与文本标注的对应关系。在文本转语音任务中,可将音频与文本对直接输入至Tacotron、FastSpeech等经典模型进行训练,或结合HiFi-GAN等声码器生成高质量语音。对于音频到音频任务,如语音转换或风格迁移,可利用干声的纯净特性进行音色特征提取。建议用户根据具体需求对数据进行分割,划分训练集、验证集与测试集,并注意音频采样率的一致性。数据集已托管于HuggingFace平台,支持通过datasets库直接加载,简化了数据流水线的搭建流程。
背景与挑战
背景概述
在语音合成与文本转语音(TTS)领域,高质量、带标注的干声数据集是驱动模型性能提升的关键资源。MomoyamaSawa/Voice-KusanagiNene数据集由社区研究者于近期创建,聚焦于日本虚拟歌手企划《プロジェクトセカイ カラフルステージ! feat. 初音ミク》中角色草薙寧寧(CV: Machico)的语音素材。该数据集收集了游戏内部分干声片段并附带标签文件,旨在为TTS及音频到音频任务提供领域特定的训练数据。尽管规模有限(1K至10K样本),但其针对单一角色语音的精细化标注,为角色语音合成、声线克隆等研究提供了稀缺的专用资源,尤其对二次元文化相关的语音技术应用具有重要推动意义。
当前挑战
该数据集面临多重挑战。首先,在领域问题层面,现有TTS数据集多针对通用语音或英文语料,而面向特定虚拟角色、兼具日语语种与二次元声线特征的干声数据极度匮乏,导致角色语音合成模型在自然度与情感表现力上难以突破。其次,构建过程中,数据仅覆盖游戏内部分语音,完整性不足,且标签格式尚待规范化;长期维护需持续补全语音并统一标注标准,同时依赖社区协作(如QQ群共享)也增加了数据获取与版本管理的复杂性。此外,版权归属(声源来自商业游戏)与许可协议(GPL-3.0)的兼容性亦需审慎处理。
常用场景
经典使用场景
该数据集聚焦于日本虚拟歌手草薙宁宁的干声语音,涵盖游戏《Project Sekai: Colorful Stage! feat. Hatsune Miku》中该角色的部分语音片段,并附带文本标签。作为一款面向日语音频处理的小规模标注资源,它最经典的使用场景在于为角色语音合成(Text-to-Speech)与音频风格迁移(Audio-to-Audio)提供高质量的源数据。研究者可基于此训练轻量级语音模型,捕捉角色独特的音色、语调与情感表达,尤其适用于二次元游戏领域的语音复现与个性化定制。
解决学术问题
该数据集回应了虚拟角色语音数据稀缺的学术困境,特别是在非英语动漫游戏角色的声学建模领域。传统语音合成依赖大规模通用语料,难以精准模拟特定角色的声线特征与表演风格。通过提供带有标签的干声片段,它解决了角色语音细粒度建模中的标注成本高、数据分散等痛点,为多说话人语音合成、小样本声音克隆以及跨模态语音生成等研究方向提供了可复用的基准资源,推动了角色驱动型语音技术的学术进展。
衍生相关工作
围绕该数据集,社区已衍生出多项扩展工作。一方面,有项目尝试整合《Project Sekai》中其他角色的语音以构建多说话人数据集,并计划公开于网盘供研究使用;另一方面,基于此数据的语音模型常被用于角色声音复刻与风格迁移实验,推动了小样本TTS在动漫领域的适配。此外,数据集的标签文件格式也启发了同类干声数据集的规范化整理,成为游戏语音资源开放共享的早期范例。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作