Nexdata/Mandarin_Speech_by_Mobile_Phone

Name: Nexdata/Mandarin_Speech_by_Mobile_Phone
Creator: Nexdata
Published: 2024-04-17 03:25:09
License: 暂无描述

Hugging Face2024-04-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Nexdata/Mandarin_Speech_by_Mobile_Phone

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集收集了来自中国33个省的6,278名说话者的数据，其中2,980名男性和3,298名女性。录音内容包括常用的口语句子，分别在安静和嘈杂的环境中进行录制。文本注释由专业注释员转录和校对，准确率不低于98%。该数据集可用于自动语音识别（ASR）和音频说话人识别任务。

提供机构：

Nexdata

原始信息汇总

数据集概述

数据集名称

名称: Nexdata/Mandarin_Speech_by_Mobile_Phone

数据集描述

数据集总结

概述: 该数据集收集了来自中国33个省份的6,278名说话者的数据，其中男性2,980人，女性3,298人。录音内容为常用口语句子，录音环境包括安静和嘈杂两种。文本转录由专业标注员进行，并经过校对，准确率不低于98%。

支持的任务和排行榜

任务: 自动语音识别（ASR）、音频说话人识别

语言

语言: 普通话

数据集结构

数据实例

信息: 待补充

数据字段

信息: 待补充

数据分割

信息: 待补充

数据集创建

数据收集理由

信息: 待补充

源数据

初始数据收集和标准化: 待补充
源语言生产者: 待补充

注释

注释过程: 待补充
注释者: 待补充

个人和敏感信息

信息: 待补充

使用数据的考虑

数据集的社会影响

信息: 待补充

偏见的讨论

信息: 待补充

其他已知限制

信息: 待补充

附加信息

数据集管理者

信息: 待补充

许可信息

许可类型: 商业许可
许可链接: https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing

引用信息

信息: 待补充

贡献

信息: 待补充

5,000+

优质数据集

54 个

任务类型

进入经典数据集