statworx/swiss-dialects
收藏Hugging Face2022-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/statworx/swiss-dialects
下载链接
链接失效反馈官方服务:
资源简介:
ArchiMob语料库代表了瑞士境内的德语语言变体。该语料库是第一个包含瑞士德语长样本转录文本的电子资源,旨在研究形态句法特征的空间分布以及用于自然语言处理。
提供机构:
statworx
原始信息汇总
数据集概述
数据集名称
ArchiMob Corpus
数据集描述
ArchiMob Corpus 是一个包含瑞士德语方言的电子资源,提供了长样本的转录文本,用于研究形态句法特征的空间分布和自然语言处理。
语言
- 瑞士德语
数据集结构
数据实例
每个数据实例包含以下字段:
sentence: 瑞士德语句子,类型为字符串。label: 方言类别,类型为字符串。
数据字段
sentence: 文本字段,类型为字符串。label: 标签字段,类型为字符串。
数据集创建
源数据
数据集来源于瑞士德语的原始录音和转录,具体信息可参考 Spur UZH。
附加信息
许可证信息
数据集遵循 Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License。
引用信息
- Scherrer, Y., T. Samardžić, E. Glaser (2019). "Digitising Swiss German -- How to process and study a polycentric spoken language". Language Resources and Evaluation. (First online)
- Scherrer, Y., T. Samardžić, E. Glaser (2019). "ArchiMob: Ein multidialektales Korpus schweizerdeutscher Spontansprache". Linguistik Online, 98(5), 425-454. DOI: 10.13092/lo.98.5947



