five

masakhane/afrixnli

收藏
Hugging Face2024-05-12 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/masakhane/afrixnli
下载链接
链接失效反馈
官方服务:
资源简介:
AFRIXNLI是一个评估数据集,包含了XNLI数据集的子集翻译成16种非洲语言,并保留了原始XNLI数据集中的英语和法语子集。它包括所有18种语言的验证集和测试集。数据实例展示了如何使用该数据集,数据字段包括前提、假设和标签,标签可能的值包括蕴含(0)、中立(1)和矛盾(2)。所有语言都有两个分割,即开发集和测试集,这些分割是原始XNLI数据集的子集。
提供机构:
masakhane
原始信息汇总

数据集卡片 for afrixnli

数据集描述

数据集摘要

AFRIXNLI 是一个评估数据集,包含将 XNLI 数据集的一个子集翻译成 16 种非洲语言的内容。它包括所有 18 种语言的验证集和测试集,保留了原始 XNLI 数据集中的英语和法语子集。

语言

数据集包含 18 种语言:

数据集结构

数据实例

英语数据实例示例如下:

python from datasets import load_dataset data = load_dataset(masakhane/afrixnli, eng)

请指定语言代码

数据点示例如下:

{ premise: The doors were locked when we went in., hypothesis: All of the doors were open., label: 0 }

数据字段

  • premise: 多语言字符串变量,
  • hypothesis: 多语言字符串变量,
  • label: 分类标签,可能的值包括 entailment (0), neutral (1), contradiction (2)。

数据分割

所有语言都有两个分割,devtest,这是原始 XNLI 数据集的 devtest 分割的子集。

分割的大小如下:

Language validation test
English 450 600
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作