step_prm
收藏魔搭社区2025-12-05 更新2025-02-15 收录
下载链接:
https://modelscope.cn/datasets/xiaodongguaAIGC/step_prm
下载链接
链接失效反馈官方服务:
资源简介:
| 数据集名称 | 是否有step | 可用于PRM训练 | 标签形式 | Title | 备注 |
| ------------- | ---------- | ------------- | ------------ | ------------------------------------------------------------ | -------------------- |
| GSM8K | ✅ | ❌ | 答案 | Training Verifiers to Solve Math Word Problems | |
| MATH | ❌ | ❌ | 答案 | Measuring Mathematical Problem Solving With the MATH Dataset | Non-Step |
| PRM800K | ✅ | ✅ | 正确类别 | Let's Verify Step by Step | prompt deduplication |
| Math-Shepherd | ✅ | ✅ | 正确类别 | Math-Shepherd: Verify and Reinforce LLMs Step-by-step without Human Annotations | Not used |
| ProcessBench | ✅ | ✅ | 首个错误步骤 | ProcessBench: Identifying Process Errors in Mathematical Reasoning | only label -1 |
| 数据集名称 | 是否包含推理步骤 | 可用于PRM(过程奖励模型,Process Reward Model)训练 | 标签形式 | 标题 | 备注 |
| ------------- | ------------ | ------------------------------------------------ | ------------ | ------------------------------------------------------------ | -------------------- |
| GSM8K | 是 | 否 | 答案 | 《训练验证器求解数学应用题》 | |
| MATH | 否 | 否 | 答案 | 《基于MATH数据集的数学问题求解能力评测》 | 非步骤类 |
| PRM800K | 是 | 是 | 正确类别 | 《循序渐进验证解题过程》 | 提示词去重 |
| Math-Shepherd | 是 | 是 | 正确类别 | 《Math-Shepherd:无需人工标注即可循序渐进验证并强化大语言模型(LLM)的解题过程》 | 未使用 |
| ProcessBench | 是 | 是 | 首个错误步骤 | 《ProcessBench:识别数学推理过程中的错误步骤》 | 仅标注-1 |
提供机构:
maas
创建时间:
2025-02-13



