five

IrokoBench|低资源语言处理数据集|自然语言处理数据集

收藏
arXiv2024-06-05 更新2024-06-21 收录
下载链接:
https://huggingface.co/collections/masakhane/irokobench-665a21b6d4714ed3f81af3b1
下载链接
链接失效反馈
资源简介:
IrokoBench是一个由Masakhane NLP创建的基准数据集,专门设计用于评估大型语言模型在16种非洲低资源语言上的表现。该数据集涵盖自然语言推理、数学推理和多选知识问答三个复杂任务。数据集通过专业翻译人员将英语评估数据集翻译成16种非洲语言,确保了数据的质量和适用性。IrokoBench的应用领域广泛,旨在解决非洲语言在人工智能领域中的代表性不足问题,推动这些语言的数字化和智能化进程。
提供机构:
Masakhane NLP
创建时间:
2024-06-05
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作