ruanchaves/assin_por_Latn_to_eng_Latn
收藏Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ruanchaves/assin_por_Latn_to_eng_Latn
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: sentence_pair_id
dtype: int64
- name: premise
dtype: string
- name: hypothesis
dtype: string
- name: relatedness_score
dtype: float32
- name: entailment_judgment
dtype:
class_label:
names:
'0': NONE
'1': ENTAILMENT
'2': PARAPHRASE
- name: __language__
dtype: string
splits:
- name: train
num_bytes: 993418
num_examples: 5000
- name: test
num_bytes: 777672
num_examples: 4000
- name: validation
num_bytes: 198351
num_examples: 1000
download_size: 0
dataset_size: 1969441
---
# Dataset Card for "assin_por_Latn_to_eng_Latn"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
ruanchaves
原始信息汇总
数据集概述
数据集特征
- sentence_pair_id: 数据类型为 int64。
- premise: 数据类型为 string。
- hypothesis: 数据类型为 string。
- relatedness_score: 数据类型为 float32。
- entailment_judgment: 数据类型为分类标签,包括:
- 0: NONE
- 1: ENTAILMENT
- 2: PARAPHRASE
- language: 数据类型为 string。
数据集分割
- train:
- 数据大小: 993418 字节
- 示例数量: 5000
- test:
- 数据大小: 777672 字节
- 示例数量: 4000
- validation:
- 数据大小: 198351 字节
- 示例数量: 1000
数据集大小
- 下载大小: 0 字节
- 数据集总大小: 1969441 字节



