Nexdata/344_People_American_English_Speech_Data_by_Mobile_Phone_Guiding
收藏Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/344_People_American_English_Speech_Data_by_Mobile_Phone_Guiding
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含344名美国本地人的语音数据,每人50句话,总有效数据时长为9.7小时,录制环境为安静的室内环境,内容涵盖车载场景、智能家居和语音助手。数据格式为16kHz、16bit、未压缩的wav单声道文件。转录内容包括文本、语音数据的时间点、2个噪声符号和5个特殊标识符。准确率为95%,不包括噪声符号和其他标识符的准确率。应用场景包括语音识别和声纹识别。
该数据集包含344名美国本地人的语音数据,每人50句话,总有效数据时长为9.7小时,录制环境为安静的室内环境,内容涵盖车载场景、智能家居和语音助手。数据格式为16kHz、16bit、未压缩的wav单声道文件。转录内容包括文本、语音数据的时间点、2个噪声符号和5个特殊标识符。准确率为95%,不包括噪声符号和其他标识符的准确率。应用场景包括语音识别和声纹识别。
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集描述
- 语言: 美式英语
- 发言人: 344位美国本地人,其中55%为男性
- 录音内容: 智能汽车、智能家居、语音助手
- 录音环境: 安静的室内环境,无回声
- 录音格式: 16kHz, 16bit, 单声道,未压缩wav格式
- 有效数据时长: 9.7小时
- 句子数量: 每位发言人50句
数据集内容
- 转录内容: 文本、语音数据的时间点、2个噪音符号、5个特殊标识符
- 准确率: 95%(不包括噪音符号和其他标识符的准确率)
应用场景
- 语音识别
- 声纹识别
许可信息
- 许可证: 商业许可证



