five

OpenR1-Math-220k|数学推理数据集|人工智能数据集

收藏
huggingface2025-02-11 更新2025-02-12 收录
数学推理
人工智能
下载链接:
https://huggingface.co/datasets/open-r1/OpenR1-Math-220k
下载链接
链接失效反馈
资源简介:
OpenR1-Math-220k是一个大规模的数学推理数据集,包含220k个数学问题和由DeepSeek R1生成的两个到四个推理轨迹。数据集分为默认和扩展两个部分,默认部分包含94k个问题,扩展部分包含131k个样本,后者引入了如cn_k12等额外数据源,提供了更多的推理轨迹。
创建时间:
2025-02-10
AI搜集汇总
数据集介绍
main_image_url
构建方式
OpenR1-Math-220k数据集的构建,是基于NuminaMath 1.5中的400k数学问题,利用DeepSeek R1模型生成解题过程。数据集的构建过程中,遵循模型卡片推荐的生成参数,并在用户提示中添加特定指令,以引导模型逐步推理并在答案中添加标记。每个问题生成两个或四个解题过程,以提供灵活的数据筛选和训练,同时支持拒绝采样和偏好优化方法。
特点
该数据集的特点在于其规模宏大,包含220k个数学问题及其解题过程,且经过Math Verify和Llama-3.3-70B-Instruct的验证,确保至少有一个正确答案的解题过程。数据集分为`default`和`extended`两个部分,后者引入了额外的数据源,尽管提供了更多的解题过程,但其性能在经过SFT后低于`default`部分。
使用方法
使用OpenR1-Math-220k数据集,可通过HuggingFace的datasets库加载。用户可以根据需要选择`default`或`extended`数据集部分。加载后,数据集可以直接用于数学推理模型的训练或评估。
背景与挑战
背景概述
OpenR1-Math-220k是一个大规模的数学推理数据集,由DeepSeek R1生成,旨在推动数学问题解决领域的研究。该数据集包含220k个数学问题,并为每个问题提供了两个到四个推理轨迹。这些轨迹经过Math Verify工具的验证,确保了答案的正确性。该数据集的创建,为研究人员提供了一个丰富的资源,以训练和评估数学推理模型,自发布以来,在数学教育和技术领域产生了显著影响。
当前挑战
该数据集面临的挑战主要包括:一是如何确保生成的数学推理轨迹的准确性和多样性,以满足不同的训练需求;二是数据集中包含的问题难度不一,导致在标准化的模型训练后性能表现有所差异,尤其是在使用cn_k12数据源时更为明显;三是构建过程中,如何高效地利用计算资源,以实现在有限时间内生成大量高质量的推理轨迹。
常用场景
经典使用场景
在数学推理研究领域,OpenR1-Math-220k数据集凭借其海量的数学问题及对应的推理轨迹,成为检验数学模型推理能力的重要资源。该数据集常被用于训练和评估数学推理模型,特别是在评估模型对于多步骤推理问题的处理能力上。
实际应用
在实际应用层面,OpenR1-Math-220k数据集可用于开发智能教育辅助系统,为学习者提供个性化的数学解题辅导。此外,它还可以被集成到在线学习平台中,通过自动化评估学生的解题过程,来优化学习体验。
衍生相关工作
基于OpenR1-Math-220k数据集,研究者们开展了一系列相关工作,如改进推理算法、开发新的评估指标以及探索适用于不同教育阶段的数学推理模型。这些研究进一步拓展了该数据集的应用范围,推动了数学教育技术的创新发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

ST-EVCDP

这是一个关于公共电动汽车充电桩的时空充电需求预测的实际数据集,涵盖了18,061个公共充电桩的数据,包括坐标、充电器数量、占用情况和价格等信息。数据集用于学术研究,支持区域电动汽车充电需求预测。

github 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录