MoritzLaurer/mnli_anli_fevernli_wanli_lingnli_xnli_test
收藏Hugging Face2023-11-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MoritzLaurer/mnli_anli_fevernli_wanli_lingnli_xnli_test
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于测试的多个NLI(自然语言推理)数据集的数据集卡片,数据以统一的格式呈现。数据集包括多个分割,如mnli_m、mnli_mm、fevernli、anli_r1、anli_r2、anli_r3、wanli、lingnli以及多种语言的xnli分割(如xnli_ar、xnli_bg等)。每个分割包含前提(premise)、假设(hypothesis)和标签(label)三个特征,标签分为entailment、neutral和contradiction三类。
提供机构:
MoritzLaurer
原始信息汇总
数据集概述
数据集名称
mnli_anli_fevernli_wanli_lingnli_xnli_test
数据集描述
测试数据集,包含多个自然语言推理(NLI)数据集的统一格式。
数据集配置
- 默认配置
- 数据文件路径
- mnli_m: data/mnli_m-*
- mnli_mm: data/mnli_mm-*
- fevernli: data/fevernli-*
- anli_r1: data/anli_r1-*
- anli_r2: data/anli_r2-*
- anli_r3: data/anli_r3-*
- wanli: data/wanli-*
- lingnli: data/lingnli-*
- xnli_ar: data/xnli_ar-*
- xnli_bg: data/xnli_bg-*
- xnli_de: data/xnli_de-*
- xnli_el: data/xnli_el-*
- xnli_en: data/xnli_en-*
- xnli_es: data/xnli_es-*
- xnli_fr: data/xnli_fr-*
- xnli_hi: data/xnli_hi-*
- xnli_ru: data/xnli_ru-*
- xnli_sw: data/xnli_sw-*
- xnli_th: data/xnli_th-*
- xnli_tr: data/xnli_tr-*
- xnli_ur: data/xnli_ur-*
- xnli_vi: data/xnli_vi-*
- xnli_zh: data/xnli_zh-*
- 数据文件路径
数据集特征
- 特征名称及数据类型
- premise: string
- hypothesis: string
- label:
- class_label:
- names:
- 0: entailment
- 1: neutral
- 2: contradiction
- names:
- class_label:
数据集分割
- 分割名称、字节数及样本数
- mnli_m: 1794523 字节, 9815 样本
- mnli_mm: 1909903 字节, 9832 样本
- fevernli: 6968676 字节, 19652 样本
- anli_r1: 405400 字节, 1000 样本
- anli_r2: 405263 字节, 1000 样本
- anli_r3: 468098 字节, 1200 样本
- wanli: 812904 字节, 5000 样本
- lingnli: 943264 字节, 4893 样本
- xnli_ar: 1294553 字节, 5010 样本
- xnli_bg: 1573034 字节, 5010 样本
- xnli_de: 996488 字节, 5010 样本
- xnli_el: 1704785 字节, 5010 样本
- xnli_en: 875134 字节, 5010 样本
- xnli_es: 969813 字节, 5010 样本
- xnli_fr: 1029239 字节, 5010 样本
- xnli_hi: 2073073 字节, 5010 样本
- xnli_ru: 1603466 字节, 5010 样本
- xnli_sw: 871651 字节, 5010 样本
- xnli_th: 2147015 字节, 5010 样本
- xnli_tr: 934934 字节, 5010 样本
- xnli_ur: 1416241 字节, 5010 样本
- xnli_vi: 1190217 字节, 5010 样本
- xnli_zh: 777929 字节, 5010 样本
数据集大小
- 下载大小: 13735153 字节
- 数据集大小: 33165603 字节



