cointegrated/nli-rus-translated-v2021

Name: cointegrated/nli-rus-translated-v2021
Creator: cointegrated
Published: 2023-10-06 14:51:23
License: 暂无描述

Hugging Face2023-10-06 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/cointegrated/nli-rus-translated-v2021

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为nli-rus-translated-v2021，由多个英文自然语言推理（NLI）数据集自动翻译成俄文组成。数据集包含训练集、开发集和测试集，每个集的特征包括前提、假设、标签、来源、分割、俄文前提、俄文假设、反向蕴含分数、长度比例和索引等。数据集的大小和下载大小也有详细说明。数据集的来源包括多个英文NLI数据集，如add_one_rte、anli_r1、anli_r2、anli_r3、copa、fever、help、iie、imppres、joci、mnli、monli、mpe、qnli、scitail、sick和snli等。

提供机构：

cointegrated

原始信息汇总

数据集概述

数据集配置

默认配置：
- 训练集：路径为 data/train-*
- 开发集：路径为 data/dev-*
- 测试集：路径为 data/test-*

数据集信息

特征：
- premise：前提，数据类型为 string
- hypothesis：假设，数据类型为 string
- label：标签，数据类型为 string
- source：来源，数据类型为 string
- split：分割，数据类型为 string
- premise_ru：俄语前提，数据类型为 string
- hypothesis_ru：俄语假设，数据类型为 string
- reverse_entailment_score：反向蕴含分数，数据类型为 float64
- len_ratio：长度比率，数据类型为 float64
- idx：索引，数据类型为 int64
分割：
- 训练集：字节数为 1156491691，样本数为 1756548
- 开发集：字节数为 78632908，样本数为 106557
- 测试集：字节数为 30464486，样本数为 34615
下载大小：504709758 字节
数据集大小：1265589085 字节

任务类别

文本分类

任务ID

自然语言推理

语言

俄语

数据集大小类别

1M<n<10M

5,000+

优质数据集

54 个

任务类型

进入经典数据集