MathXPhys_scored_v1
收藏Hugging Face2025-08-22 更新2025-08-23 收录
下载链接:
https://huggingface.co/datasets/tarona/MathXPhys_scored_v1
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含物理问题和解决方案的数据集,分为三个配置:OB_PHYS_problem、OB_PHYS_rollout和OB_PHYS_rollout_sympy。OB_PHYS_problem配置包含了问题、问题的草稿、识别的元素、计划以及重写后的问题等字段。OB_PHYS_rollout和OB_PHYS_rollout_sympy配置则包含了问题、答案、输出和推理过程等字段,其中OB_PHYS_rollout_sympy还额外包含了使用Sympy表示的答案。数据集提供了训练集分割,并包含了相应的数据大小和示例数量。
创建时间:
2025-08-22
原始信息汇总
数据集概述
基本信息
- 数据集名称: MathXPhys_scored_v1
- 来源地址: https://huggingface.co/datasets/tarona/MathXPhys_scored_v1
- 配置数量: 4个独立配置
配置详情
配置1: OB_PHYS_problem
- 样本数量: 1000
- 数据大小: 8.62 MB (下载大小: 4.40 MB)
- 特征字段:
- id (int64): 样本标识
- final_score (float64): 最终得分
- question (string): 问题内容
- problem_draft (string): 问题草稿
- element_idendified (string): 识别元素
- plan (string): 解题计划
- rewritten_problem (string): 重写后的问题
配置2: OB_PHYS_rollout
- 样本数量: 830
- 数据大小: 14.12 MB (下载大小: 5.42 MB)
- 特征字段:
- id (int64): 样本标识
- rollout (int64): 展开次数
- question (string): 问题内容
- answer (string): 答案
- output (string): 输出内容
- reasoning (string): 推理过程
配置3: OB_PHYS_rollout_sympy
- 样本数量: 830
- 数据大小: 14.15 MB (下载大小: 5.43 MB)
- 特征字段:
- 包含OB_PHYS_rollout所有字段
- answer_sympy (string): SymPy格式答案
配置4: OB_PHYS_self_consistency
- 样本数量: 65
- 数据大小: 2.02 MB (下载大小: 0 MB)
- 特征字段:
- id (int64): 样本标识
- question (string): 问题内容
- answer (string): 答案
- output (string): 输出内容
- reasoning (string): 推理过程
- answer_sympy (string): SymPy格式答案
- num_of_coincidences (float64): 一致次数
- num_of_rollout (int64): 展开次数
- consistent_rate (float64): 一致率
数据特点
- 所有配置均仅包含训练集分割
- 专注于物理数学问题求解领域
- 包含问题重写、解题计划、推理过程等丰富元数据
- 提供SymPy符号计算支持
- 包含自我一致性评估指标
搜集汇总
数据集介绍

构建方式
在物理学与数学交叉领域的研究中,MathXPhys_scored_v1数据集通过系统化采集与标注流程构建而成。该数据集整合了四个独立配置,分别涵盖问题原型、推演过程、符号计算及自洽性分析模块,每个模块均包含结构化特征字段,如问题描述、推理步骤和最终评分。数据来源基于真实物理问题求解场景,经多阶段人工与自动化处理确保质量,样本规模从65到1000条不等,形成了层次丰富的知识表示体系。
使用方法
研究人员可通过HuggingFace平台直接加载不同配置模块,针对具体任务选择相应数据子集。例如,OB_PHYS_problem适用于问题生成与评分预测研究,而OB_PHYS_rollout_sympy适合数学符号推理模型的训练与验证。每个配置均以标准表格形式存储,支持Pandas或深度学习框架直接读取,其分片存储结构优化了大批量数据访问效率,便于开展跨模态推理与自动化评分等实验。
背景与挑战
背景概述
在人工智能与计算物理交叉研究领域,MathXPhys_scored_v1数据集由科研团队于近年构建,专注于物理问题的数学建模与自动求解。该数据集通过整合问题草案、元素识别、解题计划及重写问题等结构化特征,旨在推动物理问题求解的自动化与智能化进程。其设计核心在于弥合自然语言描述与符号数学计算之间的语义鸿沟,为物理教育技术和AI辅助科研提供重要数据基础,对提升机器学习模型在科学计算领域的推理能力具有显著影响力。
当前挑战
该数据集致力于解决物理问题自动求解中的多步推理与符号计算挑战,要求模型同时处理自然语言理解和数学符号操作。构建过程中面临标注复杂性,需专家对物理问题元素进行精确识别与计划分解;同时需确保数学表达式与自然语言间的一致性,以及自我一致性评估中的统计可靠性,这些因素共同增加了数据集构建的技术难度与质量控制要求。
常用场景
经典使用场景
在物理问题求解领域,MathXPhys_scored_v1数据集通过提供包含问题草稿、元素识别和解题方案的完整标注,为机器学习模型训练提供了高质量素材。该数据集典型应用于物理问题自动求解系统的开发,研究者利用其结构化的问题表述和分步推理过程,训练模型理解物理概念并生成数学表达式。
解决学术问题
该数据集有效解决了物理教育中自动解题系统的核心挑战,包括物理概念的数学形式化转换和分步推理的建模问题。通过提供带评分的问题求解轨迹和符号化答案,为研究社区建立了评估模型物理推理能力的基准,推动了结合符号计算与神经网络的混合方法发展。
实际应用
实际应用中,该数据集支撑了智能教育辅助系统的开发,能够为学生提供个性化的物理问题求解指导。系统通过分析学生的解题过程与数据集中的标准方案进行对比,识别知识薄弱点并生成针对性反馈,显著提升了物理学习的效率和深度理解。
数据集最近研究
最新研究方向
在物理与数学交叉学科的教育技术领域,MathXPhys_scored_v1数据集正推动自动解题系统的突破性进展。该数据集通过整合问题重写、符号计算和自洽性验证等多维度标注,为大型语言模型在物理数学推理中的可解释性研究提供了关键支撑。当前研究聚焦于基于self-consistency机制的推理一致性优化,结合SymPy符号运算实现数学表达的精确解析,显著提升了复杂物理问题求解的可靠性。这类工作正深刻影响着智能教育系统的评估范式,为构建具备严格逻辑验证能力的学科专用AI奠定了理论基础。
以上内容由遇见数据集搜集并总结生成



