five

Awta

收藏
arXiv2021-06-17 更新2024-06-21 收录
下载链接:
https://github.com/mihemmed/Kurdish-Machine-Translation-Project-KMTP-1
下载链接
链接失效反馈
官方服务:
资源简介:
Awta数据集是首个大规模的中库尔德语-英语平行语料库,由哈马丹理工大学等机构创建,包含229,222对手动对齐的翻译。数据集涵盖多种文本类型和领域,旨在构建更健壮和真实的机器翻译应用。创建过程中,数据从不同来源收集并进行手动和自动对齐处理。该数据集主要应用于中库尔德语机器翻译领域,旨在解决该语言资源稀缺的问题。
提供机构:
哈马丹理工大学, 伊朗哈马丹; 阿维尼翁大学信息实验室, 法国阿维尼翁; 瑞尔森大学系统、软件与语义实验室, 加拿大多伦多; 阿拉梅赫塔巴塔巴伊大学, 伊朗德黑兰; 库亚大学教育学院英语系, 伊拉克库尔德斯坦地区
创建时间:
2021-06-17
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作