five

Eurus-2-RL-Data 数学编程问题训练数据集

收藏
超神经2025-01-08 更新2025-01-11 收录
下载链接:
https://hyper.ai/cn/datasets/36974
下载链接
链接失效反馈
官方服务:
资源简介:
Eurus-2-RL-Data 是一个专门用于强化学习训练的高质量数据集,主要应用于数学和编程问题的解决,相关 Blog 为「Process Reinforcement through Implicit Rewards」。

Eurus-2-RL-Data is a high-quality dataset dedicated to reinforcement learning training, primarily applied to solving mathematical and programming problems. Its related blog post is titled "Process Reinforcement through Implicit Rewards".
创建时间:
2025-01-06
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Eurus-2-RL-Data 是一个专为强化学习训练设计的高质量数据集,聚焦于数学和编程问题的解决。它包含约455,000个数学问题(源自NuminaMath-CoT,覆盖从中国高中数学到国际数学奥林匹克竞赛的广泛范围)和27,000个编程问题(来自APPS、CodeContests等平台,针对编程竞赛级别),并经过严格清理和筛选。该数据集主要应用于强化学习和编程竞赛领域,为模型提供有效的训练平台以优化复杂问题解决能力。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务