five

GDP29K

收藏
Hugging Face2026-04-23 更新2026-04-24 收录
下载链接:
https://huggingface.co/datasets/PeijieWang/GDP29K
下载链接
链接失效反馈
官方服务:
资源简介:
GDP-29K是一个大规模几何图形解析数据集,包含平面几何和立体几何图形,旨在推动多模态几何推理和图形理解研究。数据集分为印刷体和手写体两种风格的平面几何图形(PGDP)以及立体几何图形(SGDP),总计28,882个样本(训练集25,887个,测试集2,996个)。每个样本包含图形文件路径、几何类型、基本元素(点/线/圆等)定义、几何约束和度量关系等语义信息,采用统一正式语言规范描述,适用于图像分类和问答任务。数据集仅限研究使用。
创建时间:
2026-04-10
原始信息汇总

GDP-29K 数据集概述

基本信息

  • 数据集名称: GDP-29K
  • 许可协议: MIT
  • 任务类型: 图像分类、问答
  • 语言: 英语
  • 标签: 几何、多模态、图解解析、平面几何、立体几何
  • 数据规模: 10K < n < 100K

数据集规模

子集 印刷体PGDP 手写体PGDP SGDP 总计
训练集 13,350 4,516 8,021 25,887
测试集 1,599 500 896 2,996
总计 14,949 5,016 8,917 28,882

数据集结构

GDP-29K/ ├── PGDP/ │ ├── printed/ │ │ └── image/ │ ├── handwritten/ │ │ └── image/ │ ├── PGDP_train.json │ └── PGDP_test.json ├── SGDP/ │ ├── image/ │ ├── SGDP_train.json │ └── SGDP_test.json ├── GDP_train.json ├── GDP_test.json └── README.md

标注格式

平面几何 - 印刷体

json { "diagram": "PGDP/printed/image/xxx.png", "style": "printed", "split": "train", "category": "plane geometry", "points": ["A", "B", "C"], "lines": ["line A B C"], "circles": ["\odot O lieson A B C"], "semantics": ["AB \perp CD on E", "AB = 5", "m \angle ABC = 60"] }

平面几何 - 手写体

json { "diagram": "PGDP/handwritten/image/xxx.png", "style": "handwritten", "split": "train", "category": "plane geometry", "points": ["A", "B", "C"], "lines": ["line A B C"], "circles": ["\odot O lieson A B C"], "semantics": ["AB \parallel CD", "AB = 5", "m \angle ABC = 60"] }

立体几何

json { "diagram": "SGDP/image/xxx.png", "split": "train", "category": "solid geometry", "structure": ["Pyramid P-ABCD"], "points": ["P", "A", "B", "C", "D"], "lines": ["line A B", "line B C", "line P A"], "planes": ["plane A B C D", "plane P A B", "plane P B C"], "circles": [], "semantics": [] }

字段说明

通用字段

字段 类型 描述
diagram string 图像文件的相对路径
split string 数据集划分:train 或 test
category string 几何类型:plane geometry 或 solid geometry
points list 点标识符
lines list 线定义
circles list 圆定义
semantics list 几何约束和度量关系

PGDP特有字段

字段 类型 描述
style string 图解风格:printed 或 handwritten

SGDP特有字段

字段 类型 描述
structure list 顶层立体类型
planes list 立体结构的平面面

形式化语言规范

基本图元

语法 描述
line A B C 经过点A、B、C的直线(按顺序)
line k lieson A B C 经过点A、B、C的命名直线
odot O lieson A B C 圆心为O,经过点A、B、C的圆
plane A B C D 由顶点A、B、C、D定义的平面
Pyramid P-ABCD 顶点为P、底面为ABCD的棱锥
Cube ABCD-A1B1C1D1 由底面和顶面定义的立方体
Prism ABC-A1B1C1 由底面和顶面定义的棱柱

语义关系

语法 描述
AB perp CD on E AB垂直于CD,交于E
AB parallel CD AB平行于CD
AB = 5 线段AB的长度为5
m angle ABC = 60 角ABC的度数为60°
m widehat{AB} = 90 弧AB的度数为90°
搜集汇总
数据集介绍
main_image_url
构建方式
GDP29K是一个大规模几何图解解析数据集,涵盖了平面几何与立体几何两大领域。该数据集由三个子集构成:印刷体平面几何图解(PGDP Printed)、手写体平面几何图解(PGDP Handwritten)以及立体几何图解(SGDP),共计28,882个样本,其中训练集包含25,887个,测试集包含2,996个。数据集的构建遵循统一的形式化语言规范,每个样本均包含几何基元(如点、线、圆、平面、立体结构)的详细标注以及语义关系(如垂直、平行、长度、角度等)的精确描述,为多模态几何推理与图解理解研究提供了坚实的标注基础。
使用方法
用户可以通过加载官方提供的JSON标注文件快速使用该数据集。以Python为例,使用json.load()读取GDP_train.json与GDP_test.json即可获取所有样本。随后可根据'category'字段筛选平面几何或立体几何数据,或依据'style'字段区分印刷体与手写体样本。每个样本包含图解图像路径、几何基元列表及语义关系,适用于图文结合的多模态建模任务,例如几何图解解析、自动问答以及几何推理系统的训练与评估。数据集压缩包中的目录结构清晰,便于按子集进行数据加载与实验复现。
背景与挑战
背景概述
几何图解作为数学教育与科学文献中的核心视觉媒介,承载着空间关系与定量约束的复杂语义。然而,现有数据集多聚焦于平面几何的简单图示识别,难以支撑立体几何与多模态推理的深层研究。在此背景下,由Wang Peijie、Zhang Ming-Liang等研究者于2026年创建的GDP-29K数据集,基于统一形式化语言体系,整合了平面几何(含印刷体与手写体)及立体几何三类图解,共计28,882幅图像。该数据集由中国科学院自动化研究所等多机构联合构建,其核心研究问题在于推动几何图解解析从平面延伸至立体空间,并为多模态大模型在数学推理领域的评估提供标准化基准,对智能教育、文档理解及知识抽取等方向具有深远影响。
当前挑战
GDP-29K旨在解决几何图解理解中的双重挑战:其一,现有模型在处理立体几何图示时,常因缺乏对“金字塔-ABCD”或“立方体-A1B1C1D1”等三维结构单元的显式解析能力而失效,该数据集通过引入平面、结构等标注字段,迫使模型学习由二维投影恢复三维空间拓扑的推理路径。其二,手写体几何图示的不规则性与噪声(如笔画重叠、标注倾斜)对视觉解析构成天然屏障,数据集为此类场景提供了5,016幅手写样本,要求模型同步提升图形分割与语义对齐的鲁棒性。此外,在构建过程中,研究团队需平衡图文标注的精细度与一致性,尤其对跨类别图解(如平面共线与立体共面关系)设计统一的形式化语法,这对数据校验与质量管控提出了严峻挑战。
常用场景
经典使用场景
GDP-29K数据集是几何图解解析领域的一项开创性资源,专为训练与评估多模态几何推理模型而设计。其最经典的使用场景是基于图像的几何元素提取与形式化语义解析,涵盖平面几何(印刷体与手写体)和立体几何两大子领域。研究人员可利用该数据集将几何图形转化为结构化表示,包括点、线、圆、平面及层级结构,并通过统一的规范语言捕获其间的几何关系与约束条件。这一过程为构建具备图理解能力的深度学习模型提供了标准化的训练与测试平台,显著推动了图文融合的几何智能分析研究。
解决学术问题
在学术研究中,GDP-29K着重解决了几何图解自动解析这一长期存在的难题。传统方法多依赖人工标注或特定格式输入,难以泛化到多样化的几何图形与表达方式。该数据集通过引入统一的规范语言和细粒度注释,使得模型能够学习从像素级别的图形到符号化语义的双向映射关系,从而有效应对几何推理中感知与逻辑的双重挑战。其发布为几何问答、图解生成、教育智能辅导等方向奠定了数据基础,推动了多模态学习与形式化推理的交叉融合,具有深远的方法论意义。
实际应用
在实际应用层面,GDP-29K为自动阅卷与智能教育提供了有力的技术支撑。基于该数据集训练的模型能够自动识别学生手绘图或印刷图的结构与关系,理解几何命题,从而辅助在线学习平台实现几何题目的自动批改与个性化反馈。此外,在计算机辅助设计(CAD)与三维建模领域,该数据集的立体几何部分可用于从二维投影图中重建三维结构,提升设计效率;在文化遗产数字化中,手写几何图的解析也有助于古籍文献中几何知识的自动提取与保存。
数据集最近研究
最新研究方向
GDP-29K的发布标志着几何图解解析领域迈入大规模、多模态、统一形式语言的新纪元。当前前沿研究聚焦于借助该数据集训练模型,实现从平面几何到立体几何的端到端图解理解与语义抽取,突破传统符号推理与视觉感知的割裂瓶颈。结合大语言模型与多模态学习的热潮,GDP-29K为几何问题自动求解、教育智能辅导及科学图表推理等场景提供了关键基准,其蕴含的印刷体与手写体混合数据更推动了对真实教学中非规范化图示的鲁棒建模。该数据集的深远意义在于弥合几何形式语言与自然语言之间的鸿沟,为构建具备空间认知能力的通用人工智能体铺路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作