维语手机采集语音数据【数据堂】
收藏OpenDataLab2023-12-14 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang46
下载链接
链接失效反馈官方服务:
资源简介:
738小时维语手机采集语音数据由2,058名来自维吾尔族聚居区的人参与录制,男女均衡。录音内容为30万维语口语化句子,录音环境为安静的室内。738小时维语手机采集语音数据所有句子均经过人工精准转写,并标注了噪音标识。
This 738-hour Uyghur speech dataset collected via mobile phones involved 2,058 participants from Uyghur-concentrated regions, with a balanced gender distribution. The dataset includes 300,000 colloquial Uyghur sentences, and all recordings were conducted in quiet indoor environments. All sentences within this dataset have undergone precise manual transcription and are annotated with noise labels.
提供机构:
shujutang
创建时间:
2023-12-14
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含738小时维语手机采集的语音数据,由2,058名维吾尔族聚居区参与者录制,男女比例均衡,录音内容为30万维语句子,所有数据均经过人工转写和噪音标注。
以上内容由遇见数据集搜集并总结生成



