fairlabs/aihub-nmt-dataset-2022-07-short
收藏Hugging Face2024-03-22 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/fairlabs/aihub-nmt-dataset-2022-07-short
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含英语和韩语的文本数据,分为训练集、验证集和测试集。训练集包含1,168,269个样本,验证集包含144,993个样本,测试集包含1,000个样本。数据集的下载大小为311,780,973字节,总大小为480,581,967字节。
该数据集包含英语和韩语的文本数据,分为训练集、验证集和测试集。训练集包含1,168,269个样本,验证集包含144,993个样本,测试集包含1,000个样本。数据集的下载大小为311,780,973字节,总大小为480,581,967字节。
提供机构:
fairlabs
原始信息汇总
数据集概述
特征
- en: 数据类型为字符串
- ko: 数据类型为字符串
数据分割
- 训练集 (train)
- 字节数: 427175428
- 样本数: 1168269
- 验证集 (validation)
- 字节数: 53040723.24855986
- 样本数: 144993
- 测试集 (test)
- 字节数: 365815.75144013757
- 样本数: 1000
数据大小
- 下载大小: 311780973
- 数据集大小: 480581966.99999994
配置
- 默认配置 (default)
- 训练集路径: data/train-*
- 验证集路径: data/validation-*
- 测试集路径: data/test-*



