five

statworx/swiss-dialects

收藏
Hugging Face2022-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/statworx/swiss-dialects
下载链接
链接失效反馈
官方服务:
资源简介:
ArchiMob语料库代表了瑞士境内的德语语言变体。该语料库是第一个包含瑞士德语长样本转录文本的电子资源,旨在研究形态句法特征的空间分布以及用于自然语言处理。
提供机构:
statworx
原始信息汇总

数据集概述

数据集名称

ArchiMob Corpus

数据集描述

ArchiMob Corpus 是一个包含瑞士德语方言的电子资源,提供了长样本的转录文本,用于研究形态句法特征的空间分布和自然语言处理。

语言

  • 瑞士德语

数据集结构

数据实例

每个数据实例包含以下字段:

  • sentence: 瑞士德语句子,类型为字符串。
  • label: 方言类别,类型为字符串。

数据字段

  • sentence: 文本字段,类型为字符串。
  • label: 标签字段,类型为字符串。

数据集创建

源数据

数据集来源于瑞士德语的原始录音和转录,具体信息可参考 Spur UZH

附加信息

许可证信息

数据集遵循 Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License

引用信息

  • Scherrer, Y., T. Samardžić, E. Glaser (2019). "Digitising Swiss German -- How to process and study a polycentric spoken language". Language Resources and Evaluation. (First online)
  • Scherrer, Y., T. Samardžić, E. Glaser (2019). "ArchiMob: Ein multidialektales Korpus schweizerdeutscher Spontansprache". Linguistik Online, 98(5), 425-454. DOI: 10.13092/lo.98.5947
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作