five

Nexdata/10_Hours_Chinese_Mandarin_Synthesis_Corpus_Female_Customer_Service|语音合成数据集|客服服务数据集

收藏
hugging_face2024-04-16 更新2024-06-12 收录
语音合成
客服服务
下载链接:
https://hf-mirror.com/datasets/Nexdata/10_Hours_Chinese_Mandarin_Synthesis_Corpus_Female_Customer_Service
下载链接
链接失效反馈
资源简介:
中文普通话合成语料库-女性,客服,由中文母语者录制,声音活泼友好。音素覆盖均衡,专业语音学家参与注释,精确匹配语音合成的研究和开发需求。

中文普通话合成语料库-女性,客服,由中文母语者录制,声音活泼友好。音素覆盖均衡,专业语音学家参与注释,精确匹配语音合成的研究和开发需求。
提供机构:
Nexdata
原始信息汇总

数据集概述

基本信息

  • 名称: Chinese Mandarin Synthesis Corpus-Female, Customer Service
  • 许可证: cc-by-nc-nd-4.0
  • 语言: 普通话, 英语

录音详情

  • 格式: 48,000Hz, 16bit, 单声道无压缩wav文件
  • 录音环境: 专业录音室
  • 录音设备: 麦克风
  • 录音内容: 10,235句客户服务文本,音节、音素和声调平衡

演讲者信息

  • 性别: 女性
  • 年龄: 20-30岁
  • 声音特点: 活泼友好

标注信息

  • 标注内容: 词语和拼音转录,四级韵律边界标注,音素边界标注

应用场景

  • 主要用途: 语音合成研究与开发
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

Desert Knowledge Australia Solar Centre PV Power Data

该数据集包含来自澳大利亚Alice Springs的Site 7的太阳能发电数据,包括有功功率(AP,kW)、历史温度(T,℃)、相对湿度(RH,%)、全球水平辐照度(GHI,Wh/m²)和漫射水平辐照度(DHI,Wh/m²)。

github 收录

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。

www.nrel.gov 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录