five

ruanchaves/assin_por_Latn_to_cat_Latn

收藏
Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ruanchaves/assin_por_Latn_to_cat_Latn
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含句子对,每个样本有句子对ID、前提、假设、相关性分数、蕴含判断和语言信息。数据集分为训练集、测试集和验证集,分别有5000、4000和1000个样本。数据集总大小为2067318字节。

该数据集包含句子对,每个样本有句子对ID、前提、假设、相关性分数、蕴含判断和语言信息。数据集分为训练集、测试集和验证集,分别有5000、4000和1000个样本。数据集总大小为2067318字节。
提供机构:
ruanchaves
原始信息汇总

数据集概述

数据集特征

  • sentence_pair_id: 数据类型为 int64。
  • premise: 数据类型为 string。
  • hypothesis: 数据类型为 string。
  • relatedness_score: 数据类型为 float32。
  • entailment_judgment: 数据类型为分类标签,包含三个类别:
    • 0: NONE
    • 1: ENTAILMENT
    • 2: PARAPHRASE
  • language: 数据类型为 string。

数据集划分

  • train: 包含5000个样本,占用空间1044670字节。
  • test: 包含4000个样本,占用空间813508字节。
  • validation: 包含1000个样本,占用空间209140字节。

数据集大小

  • 下载大小: 0字节
  • 数据集总大小: 2067318字节
二维码
社区交流群
二维码
科研交流群
商业服务