five

Nexdata/344_People_American_English_Speech_Data_by_Mobile_Phone_Guiding

收藏
Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/344_People_American_English_Speech_Data_by_Mobile_Phone_Guiding
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含344名美国本地人的语音数据,每人50句话,总有效数据时长为9.7小时,录制环境为安静的室内环境,内容涵盖车载场景、智能家居和语音助手。数据格式为16kHz、16bit、未压缩的wav单声道文件。转录内容包括文本、语音数据的时间点、2个噪声符号和5个特殊标识符。准确率为95%,不包括噪声符号和其他标识符的准确率。应用场景包括语音识别和声纹识别。

该数据集包含344名美国本地人的语音数据,每人50句话,总有效数据时长为9.7小时,录制环境为安静的室内环境,内容涵盖车载场景、智能家居和语音助手。数据格式为16kHz、16bit、未压缩的wav单声道文件。转录内容包括文本、语音数据的时间点、2个噪声符号和5个特殊标识符。准确率为95%,不包括噪声符号和其他标识符的准确率。应用场景包括语音识别和声纹识别。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集描述

  • 语言: 美式英语
  • 发言人: 344位美国本地人,其中55%为男性
  • 录音内容: 智能汽车、智能家居、语音助手
  • 录音环境: 安静的室内环境,无回声
  • 录音格式: 16kHz, 16bit, 单声道,未压缩wav格式
  • 有效数据时长: 9.7小时
  • 句子数量: 每位发言人50句

数据集内容

  • 转录内容: 文本、语音数据的时间点、2个噪音符号、5个特殊标识符
  • 准确率: 95%(不包括噪音符号和其他标识符的准确率)

应用场景

  • 语音识别
  • 声纹识别

许可信息

  • 许可证: 商业许可证
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作