ruanchaves/assin_por_Latn_to_cat_Latn
收藏Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ruanchaves/assin_por_Latn_to_cat_Latn
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含句子对,每个样本有句子对ID、前提、假设、相关性分数、蕴含判断和语言信息。数据集分为训练集、测试集和验证集,分别有5000、4000和1000个样本。数据集总大小为2067318字节。
该数据集包含句子对,每个样本有句子对ID、前提、假设、相关性分数、蕴含判断和语言信息。数据集分为训练集、测试集和验证集,分别有5000、4000和1000个样本。数据集总大小为2067318字节。
提供机构:
ruanchaves
原始信息汇总
数据集概述
数据集特征
- sentence_pair_id: 数据类型为 int64。
- premise: 数据类型为 string。
- hypothesis: 数据类型为 string。
- relatedness_score: 数据类型为 float32。
- entailment_judgment: 数据类型为分类标签,包含三个类别:
- 0: NONE
- 1: ENTAILMENT
- 2: PARAPHRASE
- language: 数据类型为 string。
数据集划分
- train: 包含5000个样本,占用空间1044670字节。
- test: 包含4000个样本,占用空间813508字节。
- validation: 包含1000个样本,占用空间209140字节。
数据集大小
- 下载大小: 0字节
- 数据集总大小: 2067318字节



