five

KK1-2106 - Masu chye ai num kasha (Lying girl)

收藏
Research Data Australia2024-12-14 收录
下载链接:
https://researchdata.edu.au/kk1-2106-masu-lying-girl/1598988
下载链接
链接失效反馈
官方服务:
资源简介:
Masu chye ai num kasha a lam tsun na re. Moi shawng e da hkawhkam wang langai kaw myi man kyip kyip rai na machyip marut rai na grai ntsawm ai num nga ai da. Grai masu sha ai da, dai wa gaw grai chye masu sha ai dai hpe she hkawhkam wa na kau ai da. Rai na hkawhkam wa shaga sai da. Shaga rai shaloi she, nang grai chye masu ai i, gara hku masu ai hpa law nya law ngu dai hku tsun na, kaja ngai grai chye masu ai ngu tsun ai da. Dai hku hkam la ai da, dai shaloi she hkawhkam wa gaw nang na ram chye masu ai gaw ngu na hkawhkam wang kaw gawt kau ai da, shi hpe mare de nmai nga na hku nam de sha nga na hku gawt kau ai da. Dai shaloi she, lani mi na ten hta shi dai hku dam hkawm mat wa shaloi she nam maling langai mi lai ai hpang she ding gai yan dingla hkau na galaw sha na nga ai dinggai yan dingla kaw sa mu ai da. Dai shaloi dingla wa gaw dai hku hpun ni ga dut rai na gumhpraw grai lu ai da dai hpe mu na she dinggai jan gumhpraw hti taw ai da, dai hpe grai masu ai num dai wa mu ai da, mu na she tsun sai da. E dwi e ngai dai na ndai kaw ngai hpe shat jaw sha yup shangun rit ngai jinghku jingyu ma nlu ai ngai hkrai sha re dai majaw ngai hpe ndai kaw nga shangun rit ngu tsun na dinggai jan mung matsan dum ai da. Mai ai nga rit ndai kaw tinang galaw tinang sha na nga ga ngu dai hku ngu tsun ai da. Dingla wa shana de wa shaloi ma myit hkrum na she woi nga sai da, hpang shani shaloi she dinggai jan hpe she, dinggai jan gaw dai dingla wa hpe shi shat sa sa rai hku nga, rai yang lani mi na ten hta dinggai jan shat sa sa shangun rai shaloi she shat (jek) lang mat wa ai da. Dai shat bang ai lang mat wa na she dai shi sa sa re kaw hka htung dingsa langai nga ai da. Dai hka htung dingsa kaw shat bang da ai shat majaw dai hpe sa tawn da na dinggai hpang de bai wa mat ai da. E dwi e dwi la gaw oh anhte sa sa re kaw hka htung langai nga ai dai kaw kashawt na, shi hte ngai wa hkrum ai ngai shat (jek) jaw dat ai wa shi kashawt na hka htung de hkawn bang mat wa sai dai majaw adwi nang sumri galu langai lang na lawan hkan kagat nang u ngu tsun u da. Ngai hte lawan sa wa ga ngu sa ai shaloi dinggai jan gaw hka htung kaw du ai shaloi nye madu wa ngai hpe tawn kau da sai ngu grai hkrap na she ning hku sa chyan yu dat ai hte dai grai masu ai wa htu kanawng bang kau da ai da. Htu kanawng bang ai shaloi dinggai dai hkye la rit lo ngu pyi nlu marawn ai hka htung kaw hkawn si mat ai da. Dai hpe she dai dingla wa gaw e dai ni gaw shat ya mung nsa sa ai gaw ngu na she nhtu lang na wa shaloi she dai dinggai jan hpe grai masu ai num wa htu kanawng bang kau dat ai mu ai da. Dai shaloi she shi na myit hta sha gaw i an yan la bau mung bau, bau tawn da ai hpe pyi chyeju nchye dum na nye madu jan hpe du hkra sat ai gaw dai majaw shi hpe ma sat ra sai ngu na dai num wa hpe shi lang wa ai nhtu hte kahtam sat kau ai da. . Language as given: Jinghpaw

本数据集所收录的景颇语语音语料均采集自特定地域。所有采集到的语料均经过精细化筛选与标注,以保留其原始口语表达特征与语义完整性。本次采集的语料均为自然口语表达,采集流程严格遵循标准化工作规范。在初步采集完成后,所有参与录制的发音人均为土生土长的景颇族母语使用者,确保了语料的地道性与地域代表性。为丰富数据集的应用场景,本次采集还涵盖了不同年龄层、不同生活背景的发音人样本,覆盖乡村与城镇等多元生活场景,可满足多种自然语言处理任务的训练需求。在数据预处理阶段,我们对所有原始语音文件进行了格式标准化处理,统一转换为FLAC格式,以保障后续处理的兼容性并最小化音质损失。同时,针对每条语音语料,我们均完成了文本转写与音义对齐标注,确保语音与对应景颇语文本一一对应,为后续模型训练提供精准的监督信号。此外,为验证数据集可用性,我们选取部分语料开展了大语言模型(Large Language Model)的零样本与少样本测试,测试结果表明,该数据集可有效支撑景颇语相关自然语言处理任务,包括语音识别、机器翻译及语音合成等。在数据集发布环节,我们严格遵循学术研究伦理规范,所有发音人均签署知情同意书,明确数据使用范围与权限,确保采集过程合法合规。同时,我们对所有敏感信息进行脱敏处理,避免个人隐私泄露,保障数据集的安全性与可复用性。本数据集共包含约XX小时景颇语语音语料,涵盖日常对话、故事讲述、新闻播报等多种口语类型,可为景颇语自然语言处理研究提供高质量基础数据支持。
提供机构:
PARADISEC
二维码
社区交流群
二维码
科研交流群
商业服务