five

XNLIeu

收藏
arXiv2024-04-10 更新2024-06-21 收录
下载链接:
https://github.com/hitz-zentroa/xnli-eu
下载链接
链接失效反馈
官方服务:
资源简介:
XNLIeu是一个专为巴斯克语设计的跨语言自然语言推理(NLI)数据集,由巴斯克大学HiTZ Center - Ixa创建。该数据集包含7500个前提/假设对,通过机器翻译英语XNLI数据集并进行人工后编辑得到。数据集的创建旨在通过转移学习方法,提升巴斯克语这种低资源语言的自然语言处理能力。XNLIeu的应用领域包括信息检索、隐喻检测和关系抽取等,旨在解决巴斯克语在自然语言理解方面的资源匮乏问题。

XNLIeu is a cross-lingual natural language inference (NLI) dataset tailored specifically for Basque, developed by the HiTZ Center - Ixa at the University of the Basque Country. It consists of 7,500 premise-hypothesis pairs, which were created by machine-translating the English XNLI dataset and then undergoing manual post-editing. The dataset was constructed to enhance the natural language processing capabilities of Basque, a low-resource language, through transfer learning approaches. Application domains of XNLIeu include information retrieval, metaphor detection, relation extraction and other fields, with the goal of addressing the scarcity of natural language understanding resources for Basque.
提供机构:
HiTZ Center - Ixa, 巴斯克大学
创建时间:
2024-04-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作