collectivat/araina-text-corpus
收藏Hugging Face2022-12-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/collectivat/araina-text-corpus
下载链接
链接失效反馈官方服务:
资源简介:
Araina文本语料库包含了加斯科涅方言奥克语阿兰变体的文本。该语料库由三个子集组成:由Antòni Nogués翻译的文学文本、由Jordi Suïls Subirà编写的语言教育材料,以及来自Conselh Generau dAran的行政会议记录。该语料库是在加泰罗尼亚自治政府文化部门的支持下,作为Project Araina项目的一部分准备的。
提供机构:
collectivat
原始信息汇总
Araina Text Corpus
基本信息
- 许可证: cc0-1.0
- 语言: 奥克语(Aranese variety of Gascon dialect of Occitan)
- 多语言性: 单语种
- 数据集大小: 1M<n<10M
- 数据源: 原始数据
- 任务类别: 文本生成
- 任务ID: 语言建模
内容组成
_nogues: 由Antòni Nogués翻译的文学文本,来源自institutestudisaranesi.cat_suils: Jordi Suïls Subirà编写的语言教育材料_conselh: Conselh Generau dAran的行政程序文件
项目背景
该数据集是Project Araina项目的一部分,得到了加泰罗尼亚自治政府文化部门的支持。



