five

GeoQA

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/chen-judge/GeoQA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为GeoQA,包含了4,998个来自中国中学考试的真实几何问题,每个问题都附有描述解题过程的特定程序注释。数据集涵盖了多种问题类型,如角度计算、长度计算和面积计算等,旨在评估多模态数值推理能力,并为未来可解释数值推理研究提供了测试平台。该数据集规模达到4,998个问题,任务类型为几何问题解答。

This dataset, named GeoQA, contains 4,998 authentic geometry problems sourced from Chinese middle school examinations, each accompanied by specific programmatic annotations that detail the step-by-step problem-solving procedures. Covering diverse problem types including angle calculation, length calculation and area calculation, this dataset aims to evaluate multimodal numerical reasoning capabilities and provide a testbed for future research on interpretable numerical reasoning, focusing on the task of geometry problem solving.
提供机构:
Authors of the paper
搜集汇总
数据集介绍
main_image_url
构建方式
在几何问题求解领域,数据集的构建需兼顾文本与视觉信息的融合。GeoQA数据集通过从中国中学数学考试中收集了4,998道几何选择题,涵盖了角度计算、长度计算及其他类型问题。为确保数据质量,研究团队组织专业背景的学生依据解题解释,为每道题目标注了结构化程序,这些程序以领域特定语言编写,详细描述了从问题理解到数值计算的推理步骤。构建过程中,复杂题目被过滤,以保证程序注释的清晰性与一致性,从而为多模态数值推理研究提供了可靠基准。
使用方法
使用GeoQA数据集时,研究者可将其应用于多模态数值推理任务的训练与评估。典型流程包括:首先,分别编码问题文本与几何图表,通过协同注意力机制融合跨模态特征;随后,基于融合特征生成结构化程序序列,并利用执行器计算数值答案,以匹配选择题选项。数据集支持辅助任务设计,如图表拼图定位与几何元素预测,以增强表征学习。实验设置需遵循标准划分,使用准确率作为主要指标,从而系统验证模型在复杂几何推理中的效能。
背景与挑战
背景概述
几何问题求解作为人工智能领域的一项经典挑战,长期受到学术界关注。2022年,中山大学、深圳校区及穆罕默德·本·扎耶德人工智能大学的研究团队联合推出了GeoQA数据集,旨在推动多模态数值推理研究。该数据集聚焦于几何问答任务,包含4998道源自中国中学数学考试的多选题,每道题均配有文本描述、几何图示及程序化标注。GeoQA的构建不仅解决了先前数据集规模小、依赖手工规则的局限,更通过引入可解释的程序化求解步骤,为智能教育领域的算法开发提供了重要基准。其核心研究问题在于如何实现文本、图像与定理知识的深度融合,以完成复杂的几何推理与计算。
当前挑战
GeoQA数据集所应对的领域挑战在于几何问题的多模态数值推理,这要求模型同时解析文本描述中的语义信息、图示中的空间关系,并调用几何定理知识进行多步计算。具体而言,挑战包括文本与图像信息的对齐、模糊指代与隐含关系的理解,以及定理知识的准确应用。在构建过程中,团队面临数据规模扩展的困难,需从真实考试中收集并标注大量题目;同时,设计一套既能覆盖多样几何操作、又具备可执行性的领域特定语言亦是一大难点。此外,确保程序标注的准确性与一致性,以及处理复杂问题中的多步骤推理流程,均为数据集构建中的关键挑战。
常用场景
经典使用场景
在几何问题求解领域,GeoQA数据集作为一项多模态数值推理基准,其经典使用场景在于评估和推动模型对几何问题的综合理解能力。该数据集通过整合文本描述与几何图示,模拟了真实数学考试中的多选问题情境,为研究者提供了测试模型在解析文本、识别图示元素及运用定理知识方面性能的标准化平台。其程序化标注进一步允许模型生成可解释的求解步骤,从而在智能教育系统中,支持对几何问题求解过程的透明化分析与优化。
解决学术问题
GeoQA数据集主要解决了几何问题求解中多模态信息融合与可解释推理的学术挑战。传统方法依赖手工规则与小规模数据,难以泛化至复杂场景;而GeoQA通过大规模真实问题与程序化标注,为模型提供了学习联合推理文本与图示、并生成结构化求解步骤的数据基础。这不仅促进了神经网络在数值计算与显式推理方面的能力提升,还为多模态推理研究设立了新的评估标准,推动了该领域向更高效、可解释的方向发展。
实际应用
在实际应用层面,GeoQA数据集为智能教育系统的开发提供了关键支持。基于该数据集训练的模型能够自动解析学生提交的几何问题,结合文本与图示生成分步解答,从而在在线学习平台中实现个性化辅导与即时反馈。此外,其程序化输出有助于教育者分析学生的解题逻辑与常见错误,优化教学内容设计。这种应用不仅提升了教学效率,也为多模态人工智能技术在教育领域的落地提供了实践范例。
数据集最近研究
最新研究方向
在几何问题求解领域,GeoQA数据集的推出标志着多模态数值推理研究迈入新阶段。该数据集以其大规模、多样化的几何问题及程序标注,为深度学习模型提供了丰富的训练与评估资源。当前研究聚焦于提升模型在文本与图表间的跨模态语义对齐能力,通过引入自监督辅助任务如拼图位置预测和几何元素识别,增强图表编码器的表征学习。神经几何求解器(NGS)结合协同注意力机制,生成可解释的程序序列,推动了显式推理与模型可解释性的前沿探索。尽管现有方法在GeoQA上取得进展,但与人类性能仍存显著差距,未来研究将致力于复杂场景下的高级推理与知识集成,以缩小这一鸿沟。
相关研究论文
  • 1
    GeoQA: A Geometric Question Answering Benchmark Towards Multimodal Numerical Reasoning中山大学 · 2022年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作