MagicData-RAMC Conversational Speech Dataset
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MagicData-RAMC_Conversational_etc
下载链接
链接失效反馈官方服务:
资源简介:
MagicData-RAMC语料库包含180小时的会话语音数据,这些语音数据是通过移动电话从母语为普通话的人记录的,采样率为16 kHz。对话框中的对话框分为15个多样化的领域,并带有主题标签,从科学技术到普通生活。为每个样本手动标记准确的转录和精确的说话人语音活动时间戳。还提供了演讲者的详细信息。
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍

背景与挑战
背景概述
MagicData-RAMC语料库是一个包含180小时普通话会话语音的数据集,采样率为16kHz,涵盖15个多样化领域。每个样本均提供手动转录、说话人语音活动时间戳及演讲者详细信息,由中国科学院等机构于2022年发布。
以上内容由遇见数据集搜集并总结生成



