five

tarifit-catalan-public-services

收藏
Hugging Face2026-03-23 更新2026-03-24 收录
下载链接:
https://huggingface.co/datasets/jamalinu/tarifit-catalan-public-services
下载链接
链接失效反馈
官方服务:
资源简介:
Tarifit-Catalan 公共服务语料库是一个平行语料库,专注于 Tarifit(Riffian Tamazight)和加泰罗尼亚语之间的公共服务词汇。Tarifit 是一种柏柏尔语,约有 400 万人在摩洛哥北部 Rif 地区以及加泰罗尼亚、荷兰和比利时的侨民中使用。这是首个公开可用的 Tarifit-Catalan 平行语料库。语料库涵盖多个公共服务领域,包括问候、基本交流、城市导向、大学服务、住房、健康服务、图书馆服务、商业、银行、体育服务、邮政服务、电话、公共交通、餐饮和休闲等。数据集结构包含唯一标识符、Tarifit 文本(拉丁字母)、Tifinagh 字母(如可用)、加泰罗尼亚语翻译、来源、方言变体、主题领域、领域标签、条目类型和子类别等字段。语料库反映了 Tarifit 在都市语境中与阿拉伯语借词及法语/西班牙语借词的自然代码转换。数据来源包括巴塞罗那大学会话指南和作者原创材料。数据集适用于低资源机器翻译任务,特别适用于公共服务领域的多语言应用。
创建时间:
2026-03-22
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作