five

KK1-0646 - Nat e Nhkum ma lung hpe shapoi la ai lam (The Nhkum girl taken by a spirit)

收藏
Research Data Australia2024-12-14 收录
下载链接:
https://researchdata.edu.au/kk1-0646-nat-taken-spirit/1543233
下载链接
链接失效反馈
官方服务:
资源简介:
Ya ngai tsun na gaw nhkum ni a dama bum ngu na hpungkan ga de bumseng bum ngu ai kaw na nat e ja la ngu wa ndai nhkum ma lung ngu wa hpe shapoi la lam hpe ngai tsun na re. Moi she oh ra hpungkan ga ndai pansau yang na dingdung maga ngu na de bumseng bum ngu nga ai, bumseng bum kaw na nat e wa gaw nhkum lung ngu jan wa yaw nga ai kaw na shi shapoi la kau ai. Shapoi la kau re yang she shi gaw nat ni gaw woi la kau re na kanu kawa ni gaw nat jaw prat re nga nat galaw she galaw tim npru wa mat, tsawm ri mara 7 ning ngu na shaloi ma langai ba na wa ai da. Ma langai ba na wa yang gaw dai nta kaw wa ai shi dama wa mung gaw lawm na hku rai nga. Dama wa lawm ai gaw shinggyim masha ni re nga nmu ya. Nmu ya rai yang gaw shi gaw hpa galaw tim ma hkrai magap da, shat shadu tim ma magap da, hka ja sa tim ma magap da na kanu hpe nu ma hkum hpaw yu yaw ngu she, shi hka ja sa mat ai shaloi kanu lagu hpaw yu ai da. Lagu hpaw yu yang she madu wa nga ai gaw nmu ai re nga gaw madu wa tsun dan sam ai da. Ah nu nang ma hpaw yu ai nrai i ngu nhpaw yu ai law, hpaw yu ai hpaw yu ai ngai chye ai ngu na dai kaw na gaw shi shi a dama ga de bumseng bum de bai wa mat sai da. Wa mat nna gaw dai kaw na gaw dai ni du hkra npru wa mat ai. Npru wa mat ai rai yang e shi wa mat ai 3 ning ngu yang shi a kanam ang ai nhkum lung ngu hpe bai shapoi la hkyen ai. Ya nhkum lung si ai mung nna shi ai. Nhkum lung dai e bai shapoi la hkyen shaloi machyi hkrai machyi, machyi hkrai machyi she, dan re na shaba wawt yu yang gaw shi kamoi woi la hkyen ai nga majaw nat ni hpe nga ni jaw, wa ni jaw rai na galaw she galaw la rai na shamai la rai na ya du hkra nga ai. Dai nhkum lung ngu gaw. Oh ra jan tai ai re, dan re na bumseng bum ngu kaw na nat gaw jahtung re, grai ja ai da. Shanhte a nta grup yin hkan e nhkum ni a nta hkan e ah hpraw re na sa nga hkawm a nga, dumsu ni, oh jahkyi shan nga ni, dai makau hkan e sa nga, kade gap sha tim nga, kade gap sha ni hkawm nga dai ni gaw shanhte mayu ni hpe hpu bang ai re nga na moi kaw na anhte a kaji kawa ni hkai mat wa ai hku re. Dan re na anhte kaba wa yang gaw dai bumseng bum ngu de gaw wa shaga ai nsen ni mung grai na ai. Manau manau ai nsen ni mung oh chyingbau dum ai nsen mung grai na ai. Sanat gap ai nsen ni mung grai na ai, kalang lang gaw majan byin ai raw nga gap, shada san yu yang gaw gara de mi rai, dai bumseng bum de nat ni majan gasat ai ga rai nga. Dan re na dai bumseng bum kaw na nat ni gaw nhkum ni na dama ni re nga na dai ni du hkra anhte lang hte lang moi na ni hkai dan ai majaw ya sakse sakgan ngu na mung dai nhkum lung a kashu kasha ni mung naw nga ai. Dai hpe maumwi hpe maubyin hpe nanhte yawng hpe hkai tsun ai ga rai sai, kadai mung matut nna hkai nga ga. . Language as given: Jinghpaw

本数据集包含多组原生采集的未预处理语音样本(speech sample),所有样本均为未经筛选的原始语音数据,遵循既定采集流程获取。此外,本数据集针对特定类别的标注样本,同步提供预处理后的目标语音样本(target speech sample):所有目标语音样本均为提取得到的原生语音数据,且已完成特征抽取——即从各类标签(label)对应的语音中提取特征维度(feature dimension)与特征值(feature value),涵盖连续时序特征(sequential feature)。 本数据集的单条语音样本时长多在7秒以内,未达到该时长的样本将被归为原始语音类别。原始语音的说话人(speaker)涵盖不同口音群体,无明显停顿、断句与背景杂音,且未进行额外特征增强,仅保留原始采集的语音信号,后续可自主完成特征提取与降噪(noise reduction)处理。降噪后的语音数据为经降噪流程生成的样本。 若某条语音未被纳入本数据集,要么是其不符合合规的原始语音标准,要么是该语音存在重复(duplicate)或信息缺失(missing)的问题。时长不足3秒、存在信息缺失的样本,将被归入未完整采集的样本集合(sample set)。 针对完整的样本集合,将对其进行清晰化、标准化处理:通过规整时序对齐说话人特征与语音特征,依次完成时序规整与韵律规整,最终形成有序排列的语音数据。本数据集的所有样本均与目标语音类别相关联,可直接用于分类任务(classification task)。 本数据集包含一组语音样本,其中涵盖了停顿间隙、背景环境音(background sound)等音频片段,以及另一类平稳无重音的语音片段。针对同类样本进行聚合处理时,每个特征维度的信息均无遗漏。 经预处理后的目标语音样本,其语音特征序列(feature sequence)包含循环重复的片段、带干扰的片段、静音片段(silence segment)与动态变化的背景杂音。各类背景噪声与无意义的白噪音(white noise)会对目标语音造成干扰。 本数据集的所有标签样本,均对每个类别进行了准确清晰的标注,覆盖了样本的各类细节粒度,完整采集了各类特征、标注与元数据(metadata),所有样本均已完成标注。
提供机构:
PARADISEC
二维码
社区交流群
二维码
科研交流群
商业服务