five

Nexdata/1997_Hours_Mandarin_Speech_Data_by_Mobile_Phone_Financial_Sector

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/1997_Hours_Mandarin_Speech_Data_by_Mobile_Phone_Financial_Sector
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集收集了来自中国8个省的2000名说话者的数据,其中944名男性和1056名女性。录音内容为金融领域的句子,由专业注释者转录和校对。录音格式为16kHz、16bit、未压缩的wav文件,单声道。录音环境为安静的室内环境,低背景噪音,无回声。使用Android手机和iPhone进行录制,语言为普通话。应用场景包括语音识别和声纹识别。

该数据集收集了来自中国8个省的2000名说话者的数据,其中944名男性和1056名女性。录音内容为金融领域的句子,由专业注释者转录和校对。录音格式为16kHz、16bit、未压缩的wav文件,单声道。录音环境为安静的室内环境,低背景噪音,无回声。使用Android手机和iPhone进行录制,语言为普通话。应用场景包括语音识别和声纹识别。
提供机构:
Nexdata
原始信息汇总

数据集描述

该数据集收集了中国8个省份的2,000名说话者的数据,其中男性944名,女性1,056名。录音内容为金融领域的句子,标注文本由专业标注员转录和校对。

数据格式

16kHz,16位,未压缩的wav格式,单声道。

录音环境

安静的室内环境,低背景噪音,无回声。

录音内容

金融领域的文本。

人口统计

总共2,000名说话者,其中48%为男性,52%为女性。

设备

安卓手机,iPhone。

语言

普通话。

应用场景

语音识别;声纹识别。

许可信息

商业许可

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作