Nexdata/Mandarin_Strong_Accent_Speech_Data_by_Mobile_Phone
收藏Hugging Face2024-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Mandarin_Strong_Accent_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含超过2000名中国母语者的录音,录音者性别均衡,主要来自中国南方,部分来自中国北方带有浓重口音的省份。录音内容涵盖了手机语音助手交互、智能家居命令与控制、车载命令与控制、数字等多个领域,准确匹配了智能家居、智能汽车等实际应用场景。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别,语言为中文普通话。
This dataset contains recordings from over 2,000 native Chinese speakers with a balanced gender distribution. Most participants are from southern China, while some are from northern provinces with prominent regional accents. The recorded content covers multiple domains including mobile voice assistant interaction, smart home command and control, in-vehicle command and control, and digital-related scenarios, which precisely aligns with real-world application scenarios such as smart homes and intelligent vehicles. The tasks supported by this dataset include automatic speech recognition (ASR) and audio speaker recognition, with the language being Standard Mandarin Chinese.
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集名称
Nexdata/Mandarin_Strong_Accent_Speech_Data_by_Mobile_Phone
数据集描述
数据集摘要
- 参与者:超过2,000名中国本土说话者参与录制,性别比例均衡。
- 地域分布:主要来自中国南方,部分来自北方省份,具有浓重口音。
- 录制内容:涵盖手机语音助手交互、智能家居指令控制、车载指令控制、数字等领域,精准匹配智能家居、智能汽车等实际应用场景。
支持的任务和排行榜
- 任务:自动语音识别(ASR)、音频说话人识别。
语言
- 语言:中文普通话。
数据集结构
数据实例
- 信息:待补充。
数据字段
- 信息:待补充。
数据分割
- 信息:待补充。
数据集创建
数据选择理由
- 信息:待补充。
源数据
- 初始数据收集和标准化:待补充。
- 源语言生产者:待补充。
注释
- 注释过程:待补充。
- 注释者:待补充。
个人和敏感信息
- 信息:待补充。
使用数据的考虑
数据集的社会影响
- 信息:待补充。
偏见的讨论
- 信息:待补充。
其他已知限制
- 信息:待补充。
附加信息
数据集管理者
- 信息:待补充。
许可信息
- 许可类型:商业许可。
- 许可链接:商业许可链接
引用信息
- 信息:待补充。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



