five

cointegrated/nli-rus-translated-v2021

收藏
Hugging Face2023-10-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cointegrated/nli-rus-translated-v2021
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为nli-rus-translated-v2021,由多个英文自然语言推理(NLI)数据集自动翻译成俄文组成。数据集包含训练集、开发集和测试集,每个集的特征包括前提、假设、标签、来源、分割、俄文前提、俄文假设、反向蕴含分数、长度比例和索引等。数据集的大小和下载大小也有详细说明。数据集的来源包括多个英文NLI数据集,如add_one_rte、anli_r1、anli_r2、anli_r3、copa、fever、help、iie、imppres、joci、mnli、monli、mpe、qnli、scitail、sick和snli等。
提供机构:
cointegrated
原始信息汇总

数据集概述

数据集配置

  • 默认配置
    • 训练集:路径为 data/train-*
    • 开发集:路径为 data/dev-*
    • 测试集:路径为 data/test-*

数据集信息

  • 特征

    • premise:前提,数据类型为 string
    • hypothesis:假设,数据类型为 string
    • label:标签,数据类型为 string
    • source:来源,数据类型为 string
    • split:分割,数据类型为 string
    • premise_ru:俄语前提,数据类型为 string
    • hypothesis_ru:俄语假设,数据类型为 string
    • reverse_entailment_score:反向蕴含分数,数据类型为 float64
    • len_ratio:长度比率,数据类型为 float64
    • idx:索引,数据类型为 int64
  • 分割

    • 训练集:字节数为 1156491691,样本数为 1756548
    • 开发集:字节数为 78632908,样本数为 106557
    • 测试集:字节数为 30464486,样本数为 34615
  • 下载大小:504709758 字节

  • 数据集大小:1265589085 字节

任务类别

  • 文本分类

任务ID

  • 自然语言推理

语言

  • 俄语

数据集大小类别

  • 1M<n<10M
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作