MoritzLaurer/mnli_anli_fevernli_wanli_lingnli_xnli_train
收藏Hugging Face2023-11-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MoritzLaurer/mnli_anli_fevernli_wanli_lingnli_xnli_train
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于训练的多NLI数据集的统一格式数据,包含多个子集(如mnli、fevernli、anli等)。数据集的特征包括前提(premise)、假设(hypothesis)、标签(label)和语言(language)。标签有三个类别:entailment、neutral和contradiction。
提供机构:
MoritzLaurer
原始信息汇总
数据集概述
数据集名称
mnli_anli_fevernli_wanli_lingnli_xnli_train
数据集描述
训练数据,采用统一格式,包含多个自然语言推理(NLI)数据集。
配置
- 默认配置
数据文件
- mnli: data/mnli-*
- fevernli: data/fevernli-*
- anli: data/anli-*
- wanli: data/wanli-*
- lingnli: data/lingnli-*
- xnli: data/xnli-*
数据集信息
特征
- premise: 字符串
- hypothesis: 字符串
- label: 类别标签
- 0: entailment
- 1: neutral
- 2: contradiction
- language: 字符串
数据分割
- mnli: 75405050 字节, 392702 样本
- fevernli: 76336755 字节, 196805 样本
- anli: 64930916 字节, 162865 样本
- wanli: 17409074 字节, 102885 样本
- lingnli: 5868113 字节, 29985 样本
- xnli: 9825139 字节, 37350 样本
数据集大小
- 下载大小: 0 字节
- 数据集大小: 249775047 字节



