five

Nexdata/Mandarin_Strong_Accent_Speech_Data_by_Mobile_Phone

收藏
Hugging Face2024-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Mandarin_Strong_Accent_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含超过2000名中国母语者的录音,录音者性别均衡,主要来自中国南方,部分来自中国北方带有浓重口音的省份。录音内容涵盖了手机语音助手交互、智能家居命令与控制、车载命令与控制、数字等多个领域,准确匹配了智能家居、智能汽车等实际应用场景。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别,语言为中文普通话。

This dataset contains recordings from over 2,000 native Chinese speakers with a balanced gender distribution. Most participants are from southern China, while some are from northern provinces with prominent regional accents. The recorded content covers multiple domains including mobile voice assistant interaction, smart home command and control, in-vehicle command and control, and digital-related scenarios, which precisely aligns with real-world application scenarios such as smart homes and intelligent vehicles. The tasks supported by this dataset include automatic speech recognition (ASR) and audio speaker recognition, with the language being Standard Mandarin Chinese.
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集名称

Nexdata/Mandarin_Strong_Accent_Speech_Data_by_Mobile_Phone

数据集描述

数据集摘要

  • 参与者:超过2,000名中国本土说话者参与录制,性别比例均衡。
  • 地域分布:主要来自中国南方,部分来自北方省份,具有浓重口音。
  • 录制内容:涵盖手机语音助手交互、智能家居指令控制、车载指令控制、数字等领域,精准匹配智能家居、智能汽车等实际应用场景。

支持的任务和排行榜

  • 任务:自动语音识别(ASR)、音频说话人识别。

语言

  • 语言:中文普通话。

数据集结构

数据实例

  • 信息:待补充。

数据字段

  • 信息:待补充。

数据分割

  • 信息:待补充。

数据集创建

数据选择理由

  • 信息:待补充。

源数据

  • 初始数据收集和标准化:待补充。
  • 源语言生产者:待补充。

注释

  • 注释过程:待补充。
  • 注释者:待补充。

个人和敏感信息

  • 信息:待补充。

使用数据的考虑

数据集的社会影响

  • 信息:待补充。

偏见的讨论

  • 信息:待补充。

其他已知限制

  • 信息:待补充。

附加信息

数据集管理者

  • 信息:待补充。

许可信息

引用信息

  • 信息:待补充。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作