five

qingy2024/NuminaMath-282k-GRPO

收藏
Hugging Face2025-02-09 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/qingy2024/NuminaMath-282k-GRPO
下载链接
链接失效反馈
官方服务:
资源简介:
NuminaMath 282k GRPO数据集是一个经过清理和验证的数学问题解答数据集,基于AI-MO/NuminaMath-CoT数据集,并部分来源于flatlander1024/numinamath_verifiable_cleaned。该数据集通过筛选可以转换为sympy库的响应创建而成,适用于训练如GRPO等强化学习方法。

The NuminaMath 282k GRPO dataset is a cleaned and verifiable math question answering dataset, based on AI-MO/NuminaMath-CoT and partially derived from flatlander1024/numinamath_verifiable_cleaned. It is created by filtering responses that can be converted into sympy library, making it suitable for training reinforcement learning methods like GRPO.
提供机构:
qingy2024
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作