Nexdata/131_Hours_Mandarin_Heavy_Accent_Speech_Data_by_Mobile_Phone

Name: Nexdata/131_Hours_Mandarin_Heavy_Accent_Speech_Data_by_Mobile_Phone
Creator: Nexdata
Published: 2024-04-16 06:41:19
License: 暂无描述

Hugging Face2024-04-16 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Nexdata/131_Hours_Mandarin_Heavy_Accent_Speech_Data_by_Mobile_Phone

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集收集了来自河南、山西、四川、湖南和福建的2,568名本地人的普通话语音数据，带有浓重的地方口音。录音内容是说话者根据引导问题自由回答的句子。录音环境包括相对安静的室内环境和有噪音但不影响语音识别的正常环境。录音内容涉及智能汽车、智能家居和语音助手。人口统计信息显示，53%为女性，51%的年龄在21-30岁之间，参与者来自28个省份。录音设备包括安卓手机和iPhone。应用场景包括语音识别和声纹识别，准确性不低于98%。

提供机构：

Nexdata

原始信息汇总

数据集概述

数据集描述

来源地区：河南、山西、四川、湖南、福建
样本数量：2,568人
语言：普通话，带有浓重地方口音
录音内容：根据引导问题自由回答的句子，主题包括智能汽车、智能家居、语音助手

数据格式

音频格式：16kHz, 16bit, 单声道，未压缩wav格式

录音环境

安静室内环境：1,605人
正常环境（含不影响语音识别的噪音）：963人

人口统计信息

性别比例：女性占53%
年龄分布：21-30岁占51%
地域分布：来自28个省份，包括河南、陕西、四川、湖南、福建、黑龙江、贵州

录音设备

设备类型：Android手机、iPhone

应用场景

语音识别
声纹识别

准确率

不低于：98%

授权信息

许可证：商业许可证

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集