five

MoritzLaurer/mnli_anli_fevernli_wanli_lingnli_xnli_train

收藏
Hugging Face2023-11-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MoritzLaurer/mnli_anli_fevernli_wanli_lingnli_xnli_train
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于训练的多NLI数据集的统一格式数据,包含多个子集(如mnli、fevernli、anli等)。数据集的特征包括前提(premise)、假设(hypothesis)、标签(label)和语言(language)。标签有三个类别:entailment、neutral和contradiction。
提供机构:
MoritzLaurer
原始信息汇总

数据集概述

数据集名称

mnli_anli_fevernli_wanli_lingnli_xnli_train

数据集描述

训练数据,采用统一格式,包含多个自然语言推理(NLI)数据集。

配置

  • 默认配置

数据文件

  • mnli: data/mnli-*
  • fevernli: data/fevernli-*
  • anli: data/anli-*
  • wanli: data/wanli-*
  • lingnli: data/lingnli-*
  • xnli: data/xnli-*

数据集信息

特征

  • premise: 字符串
  • hypothesis: 字符串
  • label: 类别标签
    • 0: entailment
    • 1: neutral
    • 2: contradiction
  • language: 字符串

数据分割

  • mnli: 75405050 字节, 392702 样本
  • fevernli: 76336755 字节, 196805 样本
  • anli: 64930916 字节, 162865 样本
  • wanli: 17409074 字节, 102885 样本
  • lingnli: 5868113 字节, 29985 样本
  • xnli: 9825139 字节, 37350 样本

数据集大小

  • 下载大小: 0 字节
  • 数据集大小: 249775047 字节
二维码
社区交流群
二维码
科研交流群
商业服务