InternScience/GeoTrust

Name: InternScience/GeoTrust
Creator: InternScience
Published: 2026-05-06 07:12:40
License: 暂无描述

Hugging Face2026-05-06 更新2026-02-07 收录

下载链接：

https://hf-mirror.com/datasets/InternScience/GeoTrust

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 tags: - dataset - geometry - reasoning size_categories: - 1K<n<10K ---

提供机构：

InternScience

搜集汇总

数据集介绍

构建方式

GeoTrust数据集是一个聚焦于几何推理任务的高质量数据集，其构建以几何学领域的结构性知识为核心，旨在为机器推理提供可靠的基准测试资源。该数据集通过系统性地收集并整理几何问题及其对应的逻辑推理步骤，采用半自动化的标注流程，结合专家校验，确保每一条数据都具备严谨的推理链条与明确的几何关系表述。数据来源覆盖多种几何题型与空间构型，形成规模在1千至1万之间的精炼样本集合。

特点

该数据集的突出特点在于其对几何推理过程的深度刻画，而非仅仅关注最终答案。每一条样本均包含完整的推理路径与几何属性标注，使模型能够学习从前提条件逐步推导结论的思维模式。此外，数据集中涵盖的几何问题具有多样性，涉及平面几何与空间几何等多个维度，为评估模型的逻辑推演能力提供了丰富的场景。Apache-2.0许可证的采用则赋予了数据集广泛的开放性与应用灵活性。

使用方法

GeoTrust数据集的使用主要面向几何推理任务的模型训练与评测。研究者可将数据集划分为训练集与测试集，直接用于微调大型语言模型或专门的几何推理模块。典型应用包括输入几何描述或问题文本，模型需输出完整的推理步骤与最终结论。基于其结构化标注，用户还可对模型预测的推理链条进行精确比对，以衡量逻辑一致性，从而推动几何推理领域的算法创新与性能提升。

背景与挑战

背景概述

GeoTrust数据集是由研究机构在几何推理领域创建的高质量标注数据集，诞生于人工智能对空间逻辑理解需求日益增长的背景之下。该数据集聚焦于几何形状、空间关系与推理任务的严格标注，旨在弥合机器视觉与人类几何直觉之间的鸿沟。其核心研究问题在于如何让模型掌握超越简单模式识别的几何逻辑，从而推动智能系统在机器人导航、辅助设计等应用中的表现。自发布以来，GeoTrust因其精细的标注粒度与明确的任务定义，已成为评估几何推理算法的重要基准，对相关领域的发展产生了深远影响。

当前挑战

GeoTrust所解决的领域挑战在于几何推理任务中缺乏标准化、高精度的评估数据集，现有资源多侧重图像分类而忽视空间逻辑关系，导致模型在几何理解上表现脆弱。构建过程中面临的挑战包括：确保几何标注的一致性与精确性，避免因标注歧义影响模型泛化；平衡数据集的规模与质量，在有限样本（1K-10K）中覆盖多样化的几何结构与推理复杂度；还需要设计合理的任务划分，以有效区分模型在简单识别与复杂推理上的能力差异。

常用场景

经典使用场景

GeoTrust数据集专为几何推理任务设计，广泛应用于评估和训练人工智能模型在平面几何、立体几何及空间关系理解方面的能力。研究者常利用该数据集构建几何问题解答系统，测试模型对几何图形、角度、距离以及拓扑结构的推理水平，是几何智能领域不可或缺的基准资源。

衍生相关工作

基于GeoTrust数据集，衍生出一系列经典工作，例如几何图谱生成网络、图神经网络的几何推理框架，以及结合符号推理与深度学习的混合模型。这些工作不仅提升了模型在几何任务上的精度，还催生了新的研究方向，如可解释几何推理与零样本几何问题求解，进一步拓展了数据集的学术影响力。

数据集最近研究