five

Nexdata/131_Hours_Mandarin_Heavy_Accent_Speech_Data_by_Mobile_Phone

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/131_Hours_Mandarin_Heavy_Accent_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集收集了来自河南、山西、四川、湖南和福建的2,568名本地人的普通话语音数据,带有浓重的地方口音。录音内容是说话者根据引导问题自由回答的句子。录音环境包括相对安静的室内环境和有噪音但不影响语音识别的正常环境。录音内容涉及智能汽车、智能家居和语音助手。人口统计信息显示,53%为女性,51%的年龄在21-30岁之间,参与者来自28个省份。录音设备包括安卓手机和iPhone。应用场景包括语音识别和声纹识别,准确性不低于98%。

该数据集收集了来自河南、山西、四川、湖南和福建的2,568名本地人的普通话语音数据,带有浓重的地方口音。录音内容是说话者根据引导问题自由回答的句子。录音环境包括相对安静的室内环境和有噪音但不影响语音识别的正常环境。录音内容涉及智能汽车、智能家居和语音助手。人口统计信息显示,53%为女性,51%的年龄在21-30岁之间,参与者来自28个省份。录音设备包括安卓手机和iPhone。应用场景包括语音识别和声纹识别,准确性不低于98%。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集描述

  • 来源地区:河南、山西、四川、湖南、福建
  • 样本数量:2,568人
  • 语言:普通话,带有浓重地方口音
  • 录音内容:根据引导问题自由回答的句子,主题包括智能汽车、智能家居、语音助手

数据格式

  • 音频格式:16kHz, 16bit, 单声道,未压缩wav格式

录音环境

  • 安静室内环境:1,605人
  • 正常环境(含不影响语音识别的噪音):963人

人口统计信息

  • 性别比例:女性占53%
  • 年龄分布:21-30岁占51%
  • 地域分布:来自28个省份,包括河南、陕西、四川、湖南、福建、黑龙江、贵州

录音设备

  • 设备类型:Android手机、iPhone

应用场景

  • 语音识别
  • 声纹识别

准确率

  • 不低于:98%

授权信息

  • 许可证:商业许可证
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作