nayohan/raw_instruction_en_ko_translation
收藏Hugging Face2024-06-09 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nayohan/raw_instruction_en_ko_translation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含英语和韩语平行数据的集合,整合了多个子数据集,涵盖了问题、指令、上下文、回答等多种类型的文本。总样本数为1,474,989,总大小为2,876,922,128字节。数据集的来源包括jhflow、heegyu、lemon-mint等多个贡献者。
提供机构:
nayohan
原始信息汇总
数据集概述
数据集特征
- english: 字符串类型
- korean: 字符串类型
- from: 字符串类型
- category: 字符串类型
数据集划分
- train:
- 数据量: 2876922128.0 字节
- 示例数量: 1474989
数据集大小
- 下载大小: 1577315912 字节
- 数据集总大小: 2876922128.0 字节
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*



