ruanchaves/porsimplessent_por_Latn_to_glg_Latn
收藏Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ruanchaves/porsimplessent_por_Latn_to_glg_Latn
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: sentence1
dtype: string
- name: sentence2
dtype: string
- name: label
dtype: int32
- name: production_id
dtype: int32
- name: level
dtype: string
- name: changed
dtype: string
- name: split
dtype: string
- name: sentence_text_from
dtype: string
- name: sentence_text_to
dtype: string
- name: __language__
dtype: string
splits:
- name: train
num_bytes: 2219813
num_examples: 4976
- name: validation
num_bytes: 632532
num_examples: 1446
- name: test
num_bytes: 750592
num_examples: 1697
download_size: 0
dataset_size: 3602937
---
# Dataset Card for "porsimplessent_por_Latn_to_glg_Latn"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征字段:
- 字段名:sentence1,数据类型(dtype):字符串(string)
- 字段名:sentence2,数据类型(dtype):字符串(string)
- 字段名:label,数据类型(dtype):32位整数(int32)
- 字段名:production_id,数据类型(dtype):32位整数(int32)
- 字段名:level,数据类型(dtype):字符串(string)
- 字段名:changed,数据类型(dtype):字符串(string)
- 字段名:split,数据类型(dtype):字符串(string)
- 字段名:sentence_text_from,数据类型(dtype):字符串(string)
- 字段名:sentence_text_to,数据类型(dtype):字符串(string)
- 字段名:__language__,数据类型(dtype):字符串(string)
划分集:
- 划分集名称:train(训练集),字节数:2219813,样本量:4976
- 划分集名称:validation(验证集),字节数:632532,样本量:1446
- 划分集名称:test(测试集),字节数:750592,样本量:1697
下载大小:0
数据集总大小:3602937字节
---
# 「porsimplessent_por_Latn_to_glg_Latn」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
ruanchaves
原始信息汇总
数据集概述
数据集名称
"porsimplessent_por_Latn_to_glg_Latn"
数据集特征
- sentence1: 数据类型 - string
- sentence2: 数据类型 - string
- label: 数据类型 - int32
- production_id: 数据类型 - int32
- level: 数据类型 - string
- changed: 数据类型 - string
- split: 数据类型 - string
- sentence_text_from: 数据类型 - string
- sentence_text_to: 数据类型 - string
- language: 数据类型 - string
数据集拆分
- train:
- 字节数: 2219813
- 示例数: 4976
- validation:
- 字节数: 632532
- 示例数: 1446
- test:
- 字节数: 750592
- 示例数: 1697
数据集大小
- 下载大小: 0
- 数据集总大小: 3602937字节



