pollitoconpapass/spa-quz-translation-dataset
收藏Hugging Face2024-05-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/pollitoconpapass/spa-quz-translation-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: Spanish
dtype: string
- name: Quechua
dtype: string
splits:
- name: train
num_bytes: 20391078
num_examples: 104986
- name: validate
num_bytes: 2359089
num_examples: 13123
- name: test
num_bytes: 2367326
num_examples: 13124
download_size: 14362881
dataset_size: 25117493
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validate
path: data/validate-*
- split: test
path: data/test-*
license: mit
task_categories:
- translation
language:
- es
- qu
---
提供机构:
pollitoconpapass
原始信息汇总
数据集概述
数据集特征
- Spanish: 数据类型为字符串。
- Quechua: 数据类型为字符串。
数据集划分
- 训练集: 包含104,986个样本,占用20,391,078字节。
- 验证集: 包含13,123个样本,占用2,359,089字节。
- 测试集: 包含13,124个样本,占用2,367,326字节。
数据集大小
- 下载大小: 14,362,881字节。
- 数据集总大小: 25,117,493字节。
配置
- 默认配置:
- 训练集路径:
data/train-* - 验证集路径:
data/validate-* - 测试集路径:
data/test-*
- 训练集路径:
许可
- 许可证: MIT
任务类别
- 翻译
语言
- 西班牙语 (es)
- 克丘亚语 (qu)



