cointegrated/nli-rus-translated-v2021
收藏Hugging Face2023-10-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cointegrated/nli-rus-translated-v2021
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为nli-rus-translated-v2021,由多个英文自然语言推理(NLI)数据集自动翻译成俄文组成。数据集包含训练集、开发集和测试集,每个集的特征包括前提、假设、标签、来源、分割、俄文前提、俄文假设、反向蕴含分数、长度比例和索引等。数据集的大小和下载大小也有详细说明。数据集的来源包括多个英文NLI数据集,如add_one_rte、anli_r1、anli_r2、anli_r3、copa、fever、help、iie、imppres、joci、mnli、monli、mpe、qnli、scitail、sick和snli等。
提供机构:
cointegrated
原始信息汇总
数据集概述
数据集配置
- 默认配置:
- 训练集:路径为
data/train-* - 开发集:路径为
data/dev-* - 测试集:路径为
data/test-*
- 训练集:路径为
数据集信息
-
特征:
premise:前提,数据类型为stringhypothesis:假设,数据类型为stringlabel:标签,数据类型为stringsource:来源,数据类型为stringsplit:分割,数据类型为stringpremise_ru:俄语前提,数据类型为stringhypothesis_ru:俄语假设,数据类型为stringreverse_entailment_score:反向蕴含分数,数据类型为float64len_ratio:长度比率,数据类型为float64idx:索引,数据类型为int64
-
分割:
- 训练集:字节数为 1156491691,样本数为 1756548
- 开发集:字节数为 78632908,样本数为 106557
- 测试集:字节数为 30464486,样本数为 34615
-
下载大小:504709758 字节
-
数据集大小:1265589085 字节
任务类别
- 文本分类
任务ID
- 自然语言推理
语言
- 俄语
数据集大小类别
- 1M<n<10M



