kyujinpy/KOpen-platypus
收藏Hugging Face2023-11-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kyujinpy/KOpen-platypus
下载链接
链接失效反馈官方服务:
资源简介:
KOpenPlatypus是一个专注于提升大型语言模型逻辑推理技能的数据集,用于训练Platypus2模型。该数据集包含英语和韩语,通过使用DeepL Pro API和Selenium进行翻译,并进行了详细的后处理,包括手动修正和优化翻译结果。数据集整合了多个子数据集,通过关键词搜索和Sentence Transformers过滤,以确保问题的新颖性和挑战性。
KOpenPlatypus是一个专注于提升大型语言模型逻辑推理技能的数据集,用于训练Platypus2模型。该数据集包含英语和韩语,通过使用DeepL Pro API和Selenium进行翻译,并进行了详细的后处理,包括手动修正和优化翻译结果。数据集整合了多个子数据集,通过关键词搜索和Sentence Transformers过滤,以确保问题的新颖性和挑战性。
提供机构:
kyujinpy
原始信息汇总
KOpenPlatypus: Korean Translation dataset about Open-Platypus
数据集概述
语言
- 英语 (en)
- 韩语 (ko)
许可证
- CC BY 4.0
数据规模
- 10K < n < 100K
配置
- 默认配置 (default)
- 数据文件路径:
data/train-*
- 数据文件路径:
数据集信息
-
特征
input: 字符串类型output: 字符串类型instruction: 字符串类型data_source: 字符串类型
-
分割
train- 字节数: 34213211
- 样本数: 24926
-
下载大小
- 16662523 字节
-
数据集大小
- 34213211 字节



