Q_MathXPhys-evolve

Hugging Face2025-08-05 更新2025-08-06 收录

下载链接：

https://huggingface.co/datasets/tarona/Q_MathXPhys-evolve

下载链接

链接失效反馈

官方服务：

资源简介：

Q_MathXPhys-evolve数据集包含了数学和物理奥林匹克竞赛的问题，数据集分为两个配置：olympiadBench_r_01和olympiadBench_v3.0。每个配置都包含问题ID、问题文本、问题草稿、识别的元素、解题计划和重写后的问题等字段。数据集仅包含训练集，olympiadBench_r_01配置的训练集包含200个示例，文件大小为797511字节，下载大小为419710字节；olympiadBench_v3.0配置的训练集也包含200个示例，文件大小为629770字节，下载大小为333998字节。

创建时间：

2025-08-04

原始信息汇总

数据集概述：Q_MathXPhys-evolve

数据集基本信息

数据集名称：Q_MathXPhys-evolve
存储位置：https://huggingface.co/datasets/tarona/Q_MathXPhys-evolve

数据集配置

配置1：olympiadBench_r_01

特征字段：
- id (int64)
- question (string)
- problem_draft (string)
- element_idendified (string)
- plan (string)
- rewritten_problem (string)
数据划分：
- train (200个样本，797511字节)
下载大小：419710字节
数据集大小：797511字节

配置2：olympiadBench_v3.0

特征字段：
- id (int64)
- question (string)
- problem_draft (string)
- element_idendified (string)
- plan (string)
- rewritten_problem (string)
数据划分：
- train (200个样本，629770字节)
下载大小：333998字节
数据集大小：629770字节

数据文件路径

olympiadBench_r_01：olympiadBench_r_01/train-*
olympiadBench_v3.0：olympiadBench_v3.0/train-*

搜集汇总

数据集介绍

构建方式

在数学与物理学科交叉研究领域，Q_MathXPhys-evolve数据集通过系统化采集奥林匹克竞赛级别的试题资源构建而成。数据集采用双版本并行架构，包含olympiadBench_r_01和olympiadBench_v3.0两个配置版本，每个版本精选200道典型题目。每道题目均经过多维度标注，涵盖原始题干、问题草案、要素识别、解题方案设计以及重写后的问题表述，形成完整的解题思维链条。

特点

该数据集最显著的特征在于其结构化的问题解构体系，每个样本包含从原始问题到最终解答的完整认知轨迹。问题草案字段保留了题目构思的原始形态，要素识别模块明确标注关键知识点，解题方案设计则呈现逻辑推演过程。两个版本分别采用不同的数据处理策略，r_01版本侧重问题重构的完整性，v3.0版本则优化了数据存储效率，为研究者提供对比研究基础。

使用方法

研究者可通过HuggingFace平台直接加载特定配置版本，如olympiadBench_v3.0/train路径获取优化后的数据集。该数据集适用于数学物理问题生成、解题策略分析等研究场景，各字段可独立或组合使用。问题草案与重写问题的对应关系可用于文本重构研究，要素识别与解题方案字段则为教育知识图谱构建提供优质素材。建议结合具体研究目标选择相应版本，注意两个版本在数据处理粒度上的差异。

背景与挑战

背景概述

Q_MathXPhys-evolve数据集聚焦于数学与物理学奥林匹克竞赛领域的问题求解与重写任务，由专业研究团队构建以推动复杂科学问题的自动化处理。该数据集收录了经过结构化标注的竞赛题目及其衍生版本，包含原始问题、问题草稿、元素识别、解题计划和重写问题等关键字段，旨在为自然语言处理与教育技术交叉研究提供高质量语料。其核心价值在于通过多阶段问题演化路径的标注，揭示了人类专家级问题求解的认知过程，为AI系统模拟科学推理提供了可量化的研究框架。

当前挑战

该数据集面临的核心挑战体现在领域问题与构建过程两个维度。在领域层面，数学物理竞赛题目具有高度专业性与抽象性，要求模型同时掌握学科知识深度与多步推理能力，现有方法在长程逻辑关联和符号运算方面仍存在显著差距。构建过程中，题目要素的精准标注依赖领域专家的深度参与，元素识别与解题计划的标准化表述需要平衡专业严谨性与机器学习可用性，而问题重写环节则需保持原始题意不变的前提下实现表述多样性，这对标注一致性与质量控制提出了极高要求。

常用场景

经典使用场景

在数学和物理竞赛题自动生成领域，Q_MathXPhys-evolve数据集通过结构化的问题草稿、元素识别和改写问题等字段，为研究者提供了丰富的实验材料。该数据集特别适用于训练和评估自然语言处理模型在复杂学科问题重构方面的能力，其多阶段问题演化流程的设计，使得模型能够学习从原始问题到优化表述的完整推理链条。

衍生相关工作

基于该数据集衍生的研究已形成两个主要方向：一方面产生了多项关于竞赛题语义解析的经典工作，如基于元素识别的知识图谱构建方法；另一方面推动了问题改写技术发展，其中分层注意力改写网络和元学习增强的表述优化模型最具代表性，这些成果被广泛应用于智能题库构建系统。

数据集最近研究