Chinese NNSVS Dataset|语音合成数据集|中文方言数据集
收藏数据集概述
数据集名称
- nnsvs-chinese-support
数据集目的
- 用于创建一个适用于NNSVS的完整功能性中文数据集,包括标注过程的额外说明和示例。
语音单元
- 语音单元基于标准普通话的拼音和X-Sampa,并增加了对闽南语/台湾话方言的支持。
数据量需求
- 高质量模型:约6小时以上音频(不含静音)
- 中等质量模型:2至3小时音频(不含静音)
- 原型测试:约1小时音频(不含静音)
文件说明
Phoneme Explanations.txt
:包含所有中文语音单元的解释,其中粗体字表示语音单元的读音。/dic
文件夹:包含为NNSVS制作的字典,支持拼音输入,以及由于闽南语/台湾话方言扩展语音单元支持而增加的日语支持。
配置文件
- 训练使用的hed文件可通过
/train/config.yaml
更改。 - 训练模型时,
/conf/train/*/model/*.yaml
中的in_dim
值必须根据所选hed文件进行相应调整。
额外信息
- 提供的hed文件专为NNSVS编写,可能不适用于其他平台。
- 包含两个hed文件:完整长度和最小长度,建议使用完整长度的hed文件。
次要数据集
数据集名称
- nnsvs-korean-sub-language-support
数据集目的
- 允许中文数据库用于演唱韩语,非官方语言支持,可能存在质量问题。
字典说明
korean.table
:基于罗马化的韩文字典,用于简化输入。- 某些元音因发音限制被移除,如ㅐ, ㅒ, ㅙ, 和 ㅚ。
使用示例
- 演示了使用此字典的测试声音ACV-M1演唱的歌曲“Way Back Home”。

中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录