five

kuotient/orca-math-korean-dpo-pairs

收藏
Hugging Face2024-04-05 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/kuotient/orca-math-korean-dpo-pairs
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与orca-math数据集相关的问题和答案,主要用于数学问题的评估和生成。数据集包含四个字段:system(系统)、question(问题)、chosen(选择的答案)和rejected(拒绝的答案)。chosen和rejected字段的生成基于orca-math原始论文中的方法,根据标签的真假选择不同的答案。数据集使用CC BY-SA 4.0许可证,主要语言为韩语,包含192,848个训练示例,总大小为446,034,878字节。数据使用时必须注明来源。

该数据集包含与orca-math数据集相关的问题和答案,主要用于数学问题的评估和生成。数据集包含四个字段:system(系统)、question(问题)、chosen(选择的答案)和rejected(拒绝的答案)。chosen和rejected字段的生成基于orca-math原始论文中的方法,根据标签的真假选择不同的答案。数据集使用CC BY-SA 4.0许可证,主要语言为韩语,包含192,848个训练示例,总大小为446,034,878字节。数据使用时必须注明来源。
提供机构:
kuotient
原始信息汇总

数据集概述

数据集名称

Orca-math-korean-preference

数据集特征

  • system: 数据类型为字符串
  • question: 数据类型为字符串
  • chosen: 数据类型为字符串
  • rejected: 数据类型为字符串

数据集划分

  • train: 包含192848个样本,总大小为446034878字节

数据集大小

  • 下载大小: 162154230字节
  • 数据集总大小: 446034878字节

语言

  • 韩语 (ko)

许可证

  • cc-by-sa-4.0

数据集类别

  • 10K<n<100K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作