five

french-adja-parallel-corpus

收藏
Hugging Face2026-03-13 更新2026-03-16 收录
下载链接:
https://huggingface.co/datasets/JosueG/french-adja-parallel-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
French-Adja平行语料库是首个公开可用的Adja机器翻译平行文本数据集,针对贝宁和多哥约100万人使用的资源匮乏的Gbe语言。该数据集包含10,000个法语句子与Adja翻译的平行句子对,通过为期六个月的与贝宁Couffo地区母语Adja使用者的合作翻译努力创建。Adja(ISO 639-3: ajg)是尼日尔-刚果语系的Gbe语言,与Fon、Ewe和Gen密切相关。数据集结构包括训练集(8,000句)、验证集(1,000句)和测试集(1,000句),每个句子对包含法语句子(fr字段)和Adja翻译(adj字段)。数据集适用于机器翻译研究和其他NLP任务,特别是针对低资源非洲语言的研究。数据集采用CC BY-NC-SA 4.0许可,仅限非商业研究使用。
创建时间:
2026-03-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作