kuotient/orca-math-korean-dpo-pairs
收藏Hugging Face2024-04-05 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/kuotient/orca-math-korean-dpo-pairs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与orca-math数据集相关的问题和答案,主要用于数学问题的评估和生成。数据集包含四个字段:system(系统)、question(问题)、chosen(选择的答案)和rejected(拒绝的答案)。chosen和rejected字段的生成基于orca-math原始论文中的方法,根据标签的真假选择不同的答案。数据集使用CC BY-SA 4.0许可证,主要语言为韩语,包含192,848个训练示例,总大小为446,034,878字节。数据使用时必须注明来源。
该数据集包含与orca-math数据集相关的问题和答案,主要用于数学问题的评估和生成。数据集包含四个字段:system(系统)、question(问题)、chosen(选择的答案)和rejected(拒绝的答案)。chosen和rejected字段的生成基于orca-math原始论文中的方法,根据标签的真假选择不同的答案。数据集使用CC BY-SA 4.0许可证,主要语言为韩语,包含192,848个训练示例,总大小为446,034,878字节。数据使用时必须注明来源。
提供机构:
kuotient
原始信息汇总
数据集概述
数据集名称
Orca-math-korean-preference
数据集特征
- system: 数据类型为字符串
- question: 数据类型为字符串
- chosen: 数据类型为字符串
- rejected: 数据类型为字符串
数据集划分
- train: 包含192848个样本,总大小为446034878字节
数据集大小
- 下载大小: 162154230字节
- 数据集总大小: 446034878字节
语言
- 韩语 (ko)
许可证
- cc-by-sa-4.0
数据集类别
- 10K<n<100K



