Nexdata/Mixed_Speech_with_Chinese_and_English_Data
收藏Hugging Face2024-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Mixed_Speech_with_Chinese_and_English_Data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由1113名中国母语者录制,涵盖了七大主要方言区域。录制的文本是中英文混合的句子,包括一般场景和人机交互场景,内容丰富且转录准确。该数据集可用于提高语音识别系统对中英文混合阅读语音的识别效果。数据集支持自动语音识别和音频说话人识别任务,语言包括中文和英文。
This dataset was recorded by 1,113 native Chinese speakers, covering seven major dialect regions across China. The recorded texts are mixed Chinese-English sentences covering both general scenarios and human-computer interaction scenarios, with rich content and highly accurate transcriptions. This dataset can be used to improve the recognition performance of speech recognition systems for mixed Chinese-English read speech. It supports tasks including Automatic Speech Recognition (ASR) and Audio Speaker Recognition, with the languages involved being Chinese and English.
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集名称
Nexdata/Mixed_Speech_with_Chinese_and_English_Data_by_Mobile_Phone
数据集描述
数据集摘要
该数据集由1113名中国母语者录制,涵盖七大方言区口音。录制文本为中英文混合句子,覆盖日常场景及人机交互场景。内容丰富,转录准确,适用于提升语音识别系统对中英文混合朗读语音的识别效果。
支持的任务和排行榜
- 自动语音识别 (ASR)
- 音频说话人识别
语言
- 中文
- 英文
数据集结构
数据实例
[信息待补充]
数据字段
[信息待补充]
数据分割
[信息待补充]
数据集创建
数据收集理由
[信息待补充]
源数据
初始数据收集和标准化
[信息待补充]
源语言生产者
[信息待补充]
注释
注释过程
[信息待补充]
注释者
[信息待补充]
个人和敏感信息
[信息待补充]
使用数据的考虑
数据集的社会影响
[信息待补充]
偏见讨论
[信息待补充]
其他已知限制
[信息待补充]
附加信息
数据集管理者
[信息待补充]
许可信息
商业许可:链接
引用信息
[信息待补充]
贡献
[信息待补充]
搜集汇总
数据集介绍

构建方式
Nexdata/Mixed_Speech_with_Chinese_and_English_Data数据集的构建,是基于对1113名中国本土发音人进行录音,这些发音人涵盖了七个主要方言区域。录音内容为中文与英文句子的混合,涉及日常场景与人人交互场景。数据集的构建注重内容的丰富性及转录的准确性,旨在提升语音识别系统对中英混合阅读语音的识别效果。
特点
该数据集的特点在于其语言多样性,包含中文与英语两种语言;发音人地域广泛,覆盖多个方言区域,从而保证了语音样本的多样性。数据集内容丰富,场景涵盖广泛,既有日常生活对话,也有人与机器的交互对话,为语音识别研究提供了宝贵的学习材料。此外,该数据集的转录准确性高,有助于模型的精准训练。
使用方法
在使用Nexdata/Mixed_Speech_with_Chinese_and_English_Data数据集时,用户需遵循相应的数据使用协议。数据集可用于自动语音识别(ASR)和音频说话人识别等任务。用户可通过HuggingFace平台提供的接口获取数据集,并根据模型训练需求对数据进行相应的预处理和格式化。详细的使用方法和下载链接可在数据集的主页上找到。
背景与挑战
背景概述
Nexdata/Mixed_Speech_with_Chinese_and_English_Data数据集,创建于近年来,由Nexdata团队精心构建,旨在提升语音识别系统对中国英语混合语音的识别效果。该数据集聚集了1113名操持七大方言区域的中文母语者的录音,内容涵盖了一般场景和人际交互场景的混合中英句子,转录精确,内容丰富。它在自动语音识别领域具有重要的研究价值,为相关研究提供了宝贵的数据资源。
当前挑战
该数据集在构建过程中面临的挑战主要包括:确保方言区域覆盖的全面性,以及混合语言环境中语音识别的准确性。此外,数据集的构建还需克服个人隐私保护、数据标注质量控制和数据偏差等问题。在研究领域,如何利用该数据集有效提升语音识别算法的泛化能力和准确度,也是当前的一大挑战。
常用场景
经典使用场景
在自动语音识别领域,Nexdata/Mixed_Speech_with_Chinese_and_English_Data数据集被广泛应用于提升模型对中英混合语音的识别效果。该数据集包含1113位中国本土发音者的录音,涵盖七大方言区域,为研究提供了丰富的样本资源。
解决学术问题
该数据集有效解决了中英混合语言环境下,语音识别系统准确率不足的问题,对于改善跨语种交流的自动化处理具有重要意义。其精确的转录和多样化的场景覆盖,为学术研究提供了有力支撑。
衍生相关工作
基于该数据集,研究者们已经衍生出一系列相关工作,如改进语音识别算法、构建多语种语音合成模型等,进一步推动了语音处理技术的发展。
以上内容由遇见数据集搜集并总结生成



