five

open-r1/Big-Math-RL-Verified-Processed

收藏
Hugging Face2025-04-11 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/open-r1/Big-Math-RL-Verified-Processed
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个处理过的大型数学数据集,用于语言模型中的强化学习。数据集已经移除了无法被math-verify解析的样本和llama8b解决率为None的样本。此外,还根据llama8b解决率将数据集划分为5个难度级别,以模拟MATH数据集的难度分布。

This is a processed version of a large-scale math dataset for reinforcement learning in language models. The dataset has been filtered to remove samples that could not be parsed by math-verify or had a None llama8b_solve_rate. Additionally, the dataset is divided into 5 difficulty levels based on the quintiles of the llama8b_solve_rate, mimicking the difficulty distribution of the MATH dataset.
提供机构:
open-r1
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作