Nexdata/501_Hours_Mongolian_Spontaneous_Speech_Data
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/501_Hours_Mongolian_Spontaneous_Speech_Data
下载链接
链接失效反馈官方服务:
资源简介:
蒙古语(中国)真实世界对话和独白语音数据集,涵盖了对话、自媒体等多种内容,反映了真实世界的互动。数据集包含文本内容、说话者ID、性别等属性的转录信息。数据集从广泛且多样化的说话者中收集,地理分布广泛,有助于提高模型在真实和复杂任务中的性能。数据集的质量经过多家AI公司的测试,并且在数据收集、存储和使用过程中严格遵守数据保护法规和隐私标准,确保用户隐私和合法权益的维护。
蒙古语(中国)真实世界对话和独白语音数据集,涵盖了对话、自媒体等多种内容,反映了真实世界的互动。数据集包含文本内容、说话者ID、性别等属性的转录信息。数据集从广泛且多样化的说话者中收集,地理分布广泛,有助于提高模型在真实和复杂任务中的性能。数据集的质量经过多家AI公司的测试,并且在数据收集、存储和使用过程中严格遵守数据保护法规和隐私标准,确保用户隐私和合法权益的维护。
提供机构:
Nexdata
原始信息汇总
数据集概述
基本信息
- 许可证: 知识共享非商业性-禁止演绎4.0国际(cc-by-nc-nd-4.0)
- 语言: 蒙古语
- 地区代码: mn-CN
- 国家: 中国(CHN)
数据集描述
- 内容类别: 包含对话、自媒体等
- 录音环境: 低背景噪声
- 特征: 转录文本、时间戳、说话人ID、性别
- 准确率: 词准确率(WAR)97%
技术规格
- 格式: 16kHz, 16 bit, wav, 单声道
数据集用途
- 用于提升模型在真实和复杂任务中的性能
- 经过多家AI公司质量测试
- 严格遵守数据保护法规和隐私标准,符合GDPR、CCPA、PIPL等规定



