five

math-compositional

收藏
Hugging Face2025-06-23 更新2025-06-24 收录
下载链接:
https://huggingface.co/datasets/sunyiyou/math-compositional
下载链接
链接失效反馈
官方服务:
资源简介:
这个数据集包含各种组合数学问题设置,每个设置包括来自单个数学领域的训练数据和需要跨领域推理的测试数据。该数据集旨在评估组合数学推理能力。它有7个组合设置,总共14265个问题(14000个训练+265个测试)。数据集中的每个条目都包括字段,如'id'、'setting_key'、'domains'、'messages'、'ground_truth'等。数据集具有不同的分割,如'train'和'test',每个设置都有特定的训练来源。
创建时间:
2025-06-21
原始信息汇总

数据集概述:Compositional Math Problems - Unified Dataset with Train/Test Splits

数据集基本信息

  • 许可证: MIT
  • 数据集地址: https://huggingface.co/datasets/sunyiyou/math-compositional

数据集配置

数据集包含以下7个配置,每个配置对应不同的数学领域组合:

  1. comp_polynomial_gcd

    • 特征:
      • id (string)
      • setting_key (string)
      • setting_name (string)
      • messages (list: role (string), content (string))
      • ground_truth (string)
      • dataset (string)
    • 数据分割:
      • train: 2000个样本,133885字节
      • test: 37个样本,8641字节
    • 下载大小: 142526字节
    • 数据集大小: 142526字节
  2. comp_n_gon

    • 特征: 同上
    • 数据分割:
      • train: 2000个样本,118652字节
      • test: 21个样本,7547字节
    • 下载大小: 126199字节
    • 数据集大小: 126199字节
  3. comp_circles_algebra

    • 特征: 同上
    • 数据分割:
      • train: 2000个样本,237699字节
      • test: 27个样本,8466字节
    • 下载大小: 246165字节
    • 数据集大小: 246165字节
  4. comp_parametric_intersection

    • 特征: 同上
    • 数据分割:
      • train: 2000个样本,117519字节
      • test: 30个样本,7322字节
    • 下载大小: 124841字节
    • 数据集大小: 124841字节
  5. comp_matrix_rank

    • 特征: 同上
    • 数据分割:
      • train: 2000个样本,111610字节
      • test: 50个样本,8323字节
    • 下载大小: 119933字节
    • 数据集大小: 119933字节
  6. comp_vertex_color

    • 特征: 同上
    • 数据分割:
      • train: 2000个样本,103715字节
      • test: 50个样本,8770字节
    • 下载大小: 112485字节
    • 数据集大小: 112485字节
  7. comp_grid_chips

    • 特征: 同上
    • 数据分割:
      • train: 2000个样本,104400字节
      • test: 50个样本,9399字节
    • 下载大小: 113799字节
    • 数据集大小: 113799字节

数据集描述

  • 每个配置组合了两个不同数学领域的训练数据,并提供需要跨领域推理的组合测试问题。
  • 训练问题来自各个领域的单独数据集,测试问题专门设计用于测试跨领域推理能力。

使用示例

python from datasets import load_dataset

加载所有组合配置

dataset = load_dataset("sunyiyou/math-compositional")

加载特定组合配置

circles_data = load_dataset("sunyiyou/math-compositional", "comp_circles_algebra") train_data = circles_data["train"] # 来自各个领域的训练问题 test_data = circles_data["test"] # 需要跨领域推理的组合问题

仅加载训练或测试分割

train_only = load_dataset("sunyiyou/math-compositional", "comp_circles_algebra", split="train") test_only = load_dataset("sunyiyou/math-compositional", "comp_circles_algebra", split="test")

相关资源

  • 单独数据集: 每个训练数据集在HuggingFace上单独提供
  • 交互式探索器: Compositional Math Explorer Space
  • 文档: 查看完整文档获取实现细节
搜集汇总
数据集介绍
main_image_url
构建方式
在数学推理领域,跨领域组合问题的求解能力是评估模型智能水平的重要维度。该数据集通过整合多项式最大公约数、正多边形几何、代数圆方程等七个数学子领域的数据,采用分域采样策略构建训练集与测试集。每个子领域配置包含2000个单领域训练样本和20-50个组合测试样本,测试样本专门设计用于检验模型融合多领域知识的能力,数据以标准对话格式存储并附带基准答案。
特点
该数据集最显著的特征在于其精心设计的跨领域组合测试架构。每个子配置均包含独立领域的训练数据和需要交叉推理的组合测试题,例如代数与几何的结合问题。数据结构采用对话式交互记录,包含角色标识和内容文本,支持序列化处理。数据集规模均衡,各子领域训练样本量保持一致,测试样本则根据问题复杂度动态调整,确保评估的科学性。
使用方法
研究者可通过HuggingFace数据集库直接加载该资源,支持全数据集加载或按子领域调用。典型使用流程包括:初始化特定数学领域的训练测试分割数据,提取对话格式的问题表述和基准答案,用于模型微调或推理能力评估。数据集提供标准化的数据分割接口,可灵活获取训练集、测试集或组合使用,配套的交互式探索工具进一步降低了使用门槛。
背景与挑战
背景概述
math-compositional数据集由sunyiyou团队构建,专注于数学领域的组合推理问题研究。该数据集整合了多项式最大公约数、正多边形几何、代数圆方程、参数化交点、矩阵秩计算、顶点着色以及网格芯片布局等多个数学子领域的训练数据,并设计了需要跨领域知识融合的组合测试问题。作为数学推理领域的重要基准,该数据集通过结构化呈现不同数学分支间的内在关联,为评估模型在复杂数学问题中的组合推理能力提供了标准化测试平台。
当前挑战
该数据集面临的核心挑战体现在两个维度:在领域问题层面,如何准确评估模型对异构数学概念的组合推理能力,这要求测试问题既能保持数学严谨性又能体现跨领域特征;在构建过程层面,确保训练数据与组合测试问题间的平衡性颇具难度,需要精确控制各数学领域的知识覆盖范围,同时避免数据泄露问题。测试问题的设计需同时满足数学正确性与组合复杂性,这对问题生成算法提出了极高要求。
常用场景
经典使用场景
在数学推理与跨领域问题求解研究中,math-compositional数据集被广泛用于评估模型处理组合数学问题的能力。该数据集通过整合多项式最大公约数、n边形几何、代数圆方程等多个数学子领域的训练数据,并设计需要交叉领域推理的测试问题,为研究者提供了检验模型组合推理能力的标准化平台。深度学习模型在该数据集上的表现,能够直观反映其数学逻辑组合与迁移学习的能力水平。
实际应用
在教育科技领域,该数据集支撑了智能解题系统的开发,能够处理更接近真实考试场景的复合型数学问题。在线教育平台利用其训练模型识别学生跨章节知识的掌握程度,生成个性化的组合练习题。在自动定理证明方向,研究者基于该数据集构建的基准测试,显著提升了证明辅助系统处理包含多个数学分支的复杂命题的能力。
衍生相关工作
该数据集催生了多项重要研究,包括《Compositional Generalization in Mathematical Reasoning》等开创性论文。基于其构建的MathBERT-C模型在跨领域数学问题求解中实现了突破性进展。后续工作如MathPrompter进一步扩展了数据集的评估维度,提出了针对组合问题的链式推理评估框架,形成了数学AI领域新的研究方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作