Samsoup/mnli_test
收藏Hugging Face2024-04-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Samsoup/mnli_test
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: promptID
dtype: int32
- name: pairID
dtype: string
- name: premise
dtype: string
- name: premise_binary_parse
dtype: string
- name: premise_parse
dtype: string
- name: hypothesis
dtype: string
- name: hypothesis_binary_parse
dtype: string
- name: hypothesis_parse
dtype: string
- name: genre
dtype: string
- name: label
dtype:
class_label:
names:
'0': entailment
'1': neutral
'2': contradiction
- name: input
dtype: string
splits:
- name: train
num_bytes: 1259122
num_examples: 1000
- name: validation
num_bytes: 1197824
num_examples: 1000
- name: test
num_bytes: 1258171
num_examples: 1000
download_size: 1902209
dataset_size: 3715117
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征列表:
- 提示ID(promptID):数据类型为32位整数(int32)
- 配对ID(pairID):数据类型为字符串
- 前提(premise):数据类型为字符串
- 前提二元句法解析结果(premise_binary_parse):数据类型为字符串
- 前提句法解析结果(premise_parse):数据类型为字符串
- 假设(hypothesis):数据类型为字符串
- 假设二元句法解析结果(hypothesis_binary_parse):数据类型为字符串
- 假设句法解析结果(hypothesis_parse):数据类型为字符串
- 文本体裁(genre):数据类型为字符串
- 标签(label):数据类型为类别标签,类别映射关系为:0对应蕴含(entailment),1对应中立(neutral),2对应矛盾(contradiction)
- 输入(input):数据类型为字符串
数据划分:
- 训练集(train):字节大小1259122,样本数量1000
- 验证集(validation):字节大小1197824,样本数量1000
- 测试集(test):字节大小1258171,样本数量1000
下载总大小:1902209字节,数据集总存储大小:3715117字节
数据集配置:
- 默认配置(default):数据文件路径如下:
- 训练集:data/train-*
- 验证集:data/validation-*
- 测试集:data/test-*
提供机构:
Samsoup
原始信息汇总
数据集概述
数据集特征
- promptID: 整数类型 (int32)
- pairID: 字符串类型 (string)
- premise: 字符串类型 (string)
- premise_binary_parse: 字符串类型 (string)
- premise_parse: 字符串类型 (string)
- hypothesis: 字符串类型 (string)
- hypothesis_binary_parse: 字符串类型 (string)
- hypothesis_parse: 字符串类型 (string)
- genre: 字符串类型 (string)
- label: 分类标签,包含三个类别:0: entailment, 1: neutral, 2: contradiction
- input: 字符串类型 (string)
数据集划分
- 训练集 (train): 1000个样本,占用1259122字节
- 验证集 (validation): 1000个样本,占用1197824字节
- 测试集 (test): 1000个样本,占用1258171字节
数据集大小
- 下载大小: 1902209字节
- 数据集总大小: 3715117字节
配置
- 默认配置 (default)
- 训练数据路径: data/train-*
- 验证数据路径: data/validation-*
- 测试数据路径: data/test-*
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



