akahana/Helsinki-NLP-id
收藏Hugging Face2024-07-07 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/akahana/Helsinki-NLP-id
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含英语和印度尼西亚语之间的翻译内容,分为训练集、验证集和测试集。训练集包含1000000个样本,验证集和测试集各包含2000个样本。数据集的总下载大小为57693678字节,总数据集大小为79056682字节。
This dataset contains translations between English and Indonesian, divided into training, validation, and test sets. The training set contains 1,000,000 samples, while the validation and test sets each contain 2,000 samples. The total download size of the dataset is 57,693,678 bytes, and the total dataset size is 79,056,682 bytes.
提供机构:
akahana
原始信息汇总
数据集概述
数据特征
- 名称: translation
- 数据类型:
- 语言:
- 英语 (en)
- 印尼语 (id)
- 语言:
数据集划分
- 训练集 (train):
- 样本数量: 1,000,000
- 字节数: 78,698,973
- 验证集 (validation):
- 样本数量: 2,000
- 字节数: 180,024
- 测试集 (test):
- 样本数量: 2,000
- 字节数: 177,685
数据集大小
- 下载大小: 57,693,678 字节
- 总大小: 79,056,682 字节
配置信息
- 配置名称: default
- 数据文件路径:
- 训练集: data/train-*
- 验证集: data/validation-*
- 测试集: data/test-*



