five

PGDP5K

收藏
arXiv2022-05-20 更新2024-06-21 收录
下载链接:
http://www.nlpr.ia.ac.cn/databases/CASIA-PGDP5K/
下载链接
链接失效反馈
官方服务:
资源简介:
PGDP5K是一个大规模的平面几何图形解析数据集,由中国科学院自动化研究所模式识别国家重点实验室创建。该数据集包含5000个图形样本,涵盖16种形状、5种位置关系、22种符号类型和6种文本类型,旨在通过精细的标注提高几何图形解析的准确性。创建过程中,研究团队通过分类、标注和关系构建等步骤,确保数据集的质量和多样性。该数据集主要应用于智能教育领域,特别是解决几何问题解析的挑战,推动相关算法的发展。

PGDP5K is a large-scale planar geometry parsing dataset developed by the State Key Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Sciences. The dataset consists of 5000 graphic samples, covering 16 shape categories, 5 positional relationship types, 22 symbol types and 6 text types, aiming to improve the accuracy of geometry parsing via fine-grained annotations. During its construction, the research team ensured the quality and diversity of the dataset through procedures including classification, annotation and relationship construction. This dataset is mainly applied in the field of intelligent education, specifically addressing the challenges of geometry problem parsing and promoting the development of relevant algorithms.
提供机构:
中国科学院自动化研究所模式识别国家重点实验室
创建时间:
2022-05-20
搜集汇总
数据集介绍
main_image_url
构建方式
在平面几何问题求解领域,图解解析作为关键基础环节,其研究亟需高质量数据集支撑。PGDP5K数据集的构建遵循系统化流程:首先从中学数学教材中收集5000幅非重复几何图示,涵盖三角形、圆形及多边形等16种几何形状,确保样本多样性与教育场景真实性。随后采用半自动标注策略,结合霍夫变换算法与通用文本检测器预生成几何基元与非几何基元标注,再通过人工精细化修正。标注内容涵盖点、线、圆三类几何基元,以及细分为6大类的文本和16种子类的符号,同时构建基元间四类关系图,并基于几何先验知识自动生成可解释的几何描述语言。最后通过多轮可视化校验流程保障标注质量,形成训练集、验证集与测试集的科学划分。
特点
该数据集在几何图解解析领域展现出显著特性:其规模达到5000个样本,远超同类数据集,且几何形状分布符合教材实际的长尾规律,增强了现实代表性。标注体系突破传统粗粒度限制,实现了基元级别的细粒度标注,不仅对文本和符号进行精细化分类,还首次系统标注了基元间的空间与语义关系。更为突出的是,数据集通过定义几何命题模板,将标注关系与几何描述语言自动关联,为图解的结构化理解与下游推理任务提供了直接支持。实验表明,现有最优方法在该数据集上仅达到66.07%的F1值,印证了其因布局复杂、基元风格多变而带来的显著挑战性。
使用方法
PGDP5K数据集适用于几何图解解析的算法研究与性能评估。研究者可将其用于训练和验证基元检测模型,如基于深度学习的对象检测网络,以识别点、线、圆及各类符号与文本。在关系提取任务中,可利用标注的关系图数据,开发场景图生成或关系推理模型,学习基元间的几何约束。生成的几何描述语言可直接服务于几何问题求解系统,作为连接图解与符号推理的中间表示。使用时应遵循数据集既定划分,采用精确度、召回率及F1值等指标评估基元检测效果,并通过命题匹配度衡量描述语言生成质量。该数据集也为跨模态研究提供了基础,可结合问题文本探索几何语义理解与自动解题。
背景与挑战
背景概述
平面几何图形解析是智能教育与文档图像理解领域的关键基础任务,旨在从几何图形中提取几何基元并推理其关系,为几何问题求解提供结构化描述。PGDP5K数据集由北京交通大学与中国科学院自动化研究所的研究团队于2021年构建,其核心研究目标是解决现有几何数据集规模有限、标注粗糙、图形布局单一等问题。该数据集包含5000个涵盖16种几何形状的精细标注样本,引入了基元级细粒度标注与几何描述语言自动生成机制,显著推动了深度学习在几何图形解析中的应用,成为该领域重要的基准数据集。
当前挑战
PGDP5K数据集所针对的平面几何图形解析任务面临多重挑战:几何图形中基元种类繁多、布局复杂,且文本、符号与几何元素之间存在多样化的空间与语义关系,要求模型具备跨模态理解与结构化推理能力。在数据集构建过程中,挑战主要体现在细粒度标注的复杂性上,包括对16种符号子类与6种文本类型的精确区分,以及基元间多层次关系(如geo2geo、sym2geo)的规范化定义。此外,从真实教材中采集的图形具有长尾分布特性与风格多样性,需设计半自动标注流程与严格的质量校验机制以确保标注的一致性与准确性。
常用场景
经典使用场景
在智能教育领域,平面几何图解分析是解决几何问题的关键基础步骤。PGDP5K数据集以其精细的标注和复杂的布局,为研究者提供了评估和开发图解分析算法的理想平台。该数据集常用于训练和测试深度学习模型,以自动识别几何图中的基本元素(如点、线、圆)及其间关系,从而生成可理解的几何命题描述。通过这种方式,PGDP5K推动了图解分析任务从传统方法向数据驱动方法的转变,为几何问题求解系统的性能提升奠定了数据基础。
衍生相关工作
PGDP5K数据集的推出催生了一系列相关研究工作,特别是在几何图解分析和问题求解领域。基于该数据集的细粒度标注,研究者开发了更先进的深度学习模型,如改进的Inter-GPS方法,以提升元素检测和关系推理的性能。同时,数据集促进了几何描述语言生成任务的发展,使得从图解到符号命题的转换更加准确。这些工作不仅扩展了解析算法的适用范围,还为几何知识表示和推理提供了新思路,推动了智能教育中多模态理解技术的进步,例如结合文本和图解的几何问题自动解答系统。
数据集最近研究
最新研究方向
在智能教育与文档图像理解领域,平面几何图形解析作为几何问题求解的基础环节,其研究正朝着深度学习方法与细粒度标注数据集紧密结合的方向演进。PGDP5K数据集的推出,以其大规模样本和精细的原始标注,为几何图形解析任务设立了新的基准。前沿研究聚焦于利用场景图生成技术,从复杂几何图形中提取点、线、圆等几何基元及其相互关系,并自动生成可理解的几何描述语言,以支持下游的几何问题自动求解。尽管当前最先进的方法在该数据集上的F1值仅为66.07%,揭示了图形布局复杂性与基元关系多样性带来的显著挑战,这进一步推动了基于深度学习的端到端解析算法、多模态信息融合以及符号推理结合等热点方向的探索。该数据集不仅促进了几何图形理解技术的进步,也为智能教育系统中的自适应学习与自动解题应用提供了关键支撑。
相关研究论文
  • 1
    PGDP5K: A Diagram Parsing Dataset for Plane Geometry Problems中国科学院自动化研究所模式识别国家重点实验室 · 2022年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作