five

MoritzLaurer/mnli_anli_fevernli_wanli_lingnli_xnli_test

收藏
Hugging Face2023-11-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MoritzLaurer/mnli_anli_fevernli_wanli_lingnli_xnli_test
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于测试的多个NLI(自然语言推理)数据集的数据集卡片,数据以统一的格式呈现。数据集包括多个分割,如mnli_m、mnli_mm、fevernli、anli_r1、anli_r2、anli_r3、wanli、lingnli以及多种语言的xnli分割(如xnli_ar、xnli_bg等)。每个分割包含前提(premise)、假设(hypothesis)和标签(label)三个特征,标签分为entailment、neutral和contradiction三类。
提供机构:
MoritzLaurer
原始信息汇总

数据集概述

数据集名称

mnli_anli_fevernli_wanli_lingnli_xnli_test

数据集描述

测试数据集,包含多个自然语言推理(NLI)数据集的统一格式。

数据集配置

  • 默认配置
    • 数据文件路径
      • mnli_m: data/mnli_m-*
      • mnli_mm: data/mnli_mm-*
      • fevernli: data/fevernli-*
      • anli_r1: data/anli_r1-*
      • anli_r2: data/anli_r2-*
      • anli_r3: data/anli_r3-*
      • wanli: data/wanli-*
      • lingnli: data/lingnli-*
      • xnli_ar: data/xnli_ar-*
      • xnli_bg: data/xnli_bg-*
      • xnli_de: data/xnli_de-*
      • xnli_el: data/xnli_el-*
      • xnli_en: data/xnli_en-*
      • xnli_es: data/xnli_es-*
      • xnli_fr: data/xnli_fr-*
      • xnli_hi: data/xnli_hi-*
      • xnli_ru: data/xnli_ru-*
      • xnli_sw: data/xnli_sw-*
      • xnli_th: data/xnli_th-*
      • xnli_tr: data/xnli_tr-*
      • xnli_ur: data/xnli_ur-*
      • xnli_vi: data/xnli_vi-*
      • xnli_zh: data/xnli_zh-*

数据集特征

  • 特征名称及数据类型
    • premise: string
    • hypothesis: string
    • label:
      • class_label:
        • names:
          • 0: entailment
          • 1: neutral
          • 2: contradiction

数据集分割

  • 分割名称、字节数及样本数
    • mnli_m: 1794523 字节, 9815 样本
    • mnli_mm: 1909903 字节, 9832 样本
    • fevernli: 6968676 字节, 19652 样本
    • anli_r1: 405400 字节, 1000 样本
    • anli_r2: 405263 字节, 1000 样本
    • anli_r3: 468098 字节, 1200 样本
    • wanli: 812904 字节, 5000 样本
    • lingnli: 943264 字节, 4893 样本
    • xnli_ar: 1294553 字节, 5010 样本
    • xnli_bg: 1573034 字节, 5010 样本
    • xnli_de: 996488 字节, 5010 样本
    • xnli_el: 1704785 字节, 5010 样本
    • xnli_en: 875134 字节, 5010 样本
    • xnli_es: 969813 字节, 5010 样本
    • xnli_fr: 1029239 字节, 5010 样本
    • xnli_hi: 2073073 字节, 5010 样本
    • xnli_ru: 1603466 字节, 5010 样本
    • xnli_sw: 871651 字节, 5010 样本
    • xnli_th: 2147015 字节, 5010 样本
    • xnli_tr: 934934 字节, 5010 样本
    • xnli_ur: 1416241 字节, 5010 样本
    • xnli_vi: 1190217 字节, 5010 样本
    • xnli_zh: 777929 字节, 5010 样本

数据集大小

  • 下载大小: 13735153 字节
  • 数据集大小: 33165603 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作