davidkim205/kollm-comparision
收藏Hugging Face2024-03-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/davidkim205/kollm-comparision
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于文本生成的韩语数据集,包含多个字段如instruction、input、output和src。数据集由多个公开数据集和内部数据集组成,包括KoBEST、Belebele、CSATQA、PAWS-X、Orca-DPO-Pairs-KO等。数据集主要用于训练和评估文本生成模型。
提供机构:
davidkim205
原始信息汇总
数据集概述
数据集基本信息
- 许可证: Apache-2.0
- 数据集大小: 123,837,782字节
- 下载大小: 66,685,801字节
数据集特征
- instruction: 数据类型为字符串
- input: 数据类型为字符串
- output: 数据类型为字符串序列
- src: 数据类型为字符串
数据集分割
- train: 包含116,166个示例,总字节数为123,837,782
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*
任务类别
- text-generation
语言
- ko (韩语)



