five

维语手机采集语音数据【数据堂】

收藏
OpenDataLab2023-12-14 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang46
下载链接
链接失效反馈
官方服务:
资源简介:
738小时维语手机采集语音数据由2,058名来自维吾尔族聚居区的人参与录制,男女均衡。录音内容为30万维语口语化句子,录音环境为安静的室内。738小时维语手机采集语音数据所有句子均经过人工精准转写,并标注了噪音标识。

This 738-hour Uyghur speech dataset collected via mobile phones involved 2,058 participants from Uyghur-concentrated regions, with a balanced gender distribution. The dataset includes 300,000 colloquial Uyghur sentences, and all recordings were conducted in quiet indoor environments. All sentences within this dataset have undergone precise manual transcription and are annotated with noise labels.
提供机构:
shujutang
创建时间:
2023-12-14
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含738小时维语手机采集的语音数据,由2,058名维吾尔族聚居区参与者录制,男女比例均衡,录音内容为30万维语句子,所有数据均经过人工转写和噪音标注。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务