five

Nexdata/198_Hours_Malaysian_English_Speech_Data_by_Mobile_Phone

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/198_Hours_Malaysian_English_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个马来西亚英语脚本独白智能手机语音数据集,基于给定脚本的独白收集,涵盖了通用领域、人机交互、智能家居命令与控制、车载命令与控制、数字等多个领域。数据集经过转录,包含文本内容和其他属性。数据收集自423名多样化的说话者,地理上覆盖广泛,以增强模型在真实和复杂任务中的表现。数据集的质量经过多家AI公司的测试,并严格遵守数据保护法规和隐私标准,确保在数据收集、存储和使用过程中维护用户隐私和合法权益,符合GDPR、CCPA、PIPL等法规。

这是一个马来西亚英语脚本独白智能手机语音数据集,基于给定脚本的独白收集,涵盖了通用领域、人机交互、智能家居命令与控制、车载命令与控制、数字等多个领域。数据集经过转录,包含文本内容和其他属性。数据收集自423名多样化的说话者,地理上覆盖广泛,以增强模型在真实和复杂任务中的表现。数据集的质量经过多家AI公司的测试,并严格遵守数据保护法规和隐私标准,确保在数据收集、存储和使用过程中维护用户隐私和合法权益,符合GDPR、CCPA、PIPL等法规。
提供机构:
Nexdata
原始信息汇总

数据集概述

基本信息

  • 许可证: CC-BY-NC-ND-4.0
  • 语言: 英语
  • 国家: 马来西亚
  • 录音设备: Android智能手机, iPhone
  • 总发言人: 423人
  • 性别分布: 53%女性(225人),47%男性(198人)

技术规格

  • 格式: 16kHz, 16bit, 单声道, 未压缩wav格式
  • 录音条件: 低背景噪声(室内),无回声

内容分类

  • 通用领域
  • 人机交互
  • 智能家居控制
  • 车载控制
  • 数字

准确率

  • 句子准确率(SAR): 95%

合规性

  • 遵守数据保护法规和隐私标准,符合GDPR, CCPA, PIPL要求
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作