H-GEO

Hugging Face2025-05-26 更新2025-05-27 收录

下载链接：

https://huggingface.co/datasets/TDT000/H-GEO

下载链接

链接失效反馈

官方服务：

资源简介：

H-GEO是一个包含几何问题、LLM错误及其修正的图片和中文文本数据集，支持微调以减少几何推理中的虚构现象。

创建时间：

2025-05-25

原始信息汇总

H-GEO数据集概述

数据集简介

H-GEO是一个包含几何问题、大语言模型(LLM)错误及其修正的中文图文数据集，主要用于微调模型以减少几何推理中的幻觉现象。

数据内容

问题文本：包含在FTtrain.json和FTtest.json文件中
数据类型：图像和中文文本的组合
核心特征：
- 几何数学问题
- LLM生成的错误答案
- 对应的错误分析和修正
- 正确答案

数据结构

采用JSON格式，每个条目包含：

messages数组：
- 用户角色：提供数学问题及错误答案
- 助手角色：包含：
  - 错误答案的推理/计算部分分析
  - 错误定位
  - 修正过程
  - 正确答案
images数组：关联的几何图形图像路径

数据量

训练集(FTtrain.json)：3,944条
测试集(FTtest.json)：327条
图像文件：3,742个
注：部分错误答案对应相同原始问题

许可信息

许可证类型：MIT License

搜集汇总

数据集介绍

构建方式

H-GEO数据集聚焦于几何问题求解领域，通过系统化收集包含视觉信息的数学问题及其典型错误解答构建而成。该数据集采用双文件结构存储，FTtrain.json包含3944条训练样本，FTtest.json则提供327条测试样本，所有数据均以标准化的JSON格式组织，每条记录包含问题描述、错误解答、修正过程及关联的几何图示，形成完整的错误分析-修正闭环。

使用方法

该数据集适用于几何推理模型的微调与评估，使用者可通过加载FTtrain.json进行模型训练，利用FTtest.json验证模型性能。典型应用流程包括：解析messages字段中的问题描述与错误解答，结合images字段的图示进行多模态输入；根据role字段区分的对话角色，构建监督学习任务；重点分析assistant角色提供的错误定位与修正内容，优化模型在几何推理中的准确性与纠错能力。数据集采用MIT许可协议，支持学术与商业场景的灵活使用。

背景与挑战

背景概述

H-GEO数据集是一个专注于几何问题、大型语言模型（LLM）错误及其修正的中文文本与图像数据集，旨在支持微调以减少几何推理中的幻觉现象。该数据集由研究团队在几何推理与自然语言处理交叉领域构建，通过整合几何问题、错误答案及修正过程，为提升LLM在几何推理任务中的准确性和可靠性提供了重要资源。其核心研究问题聚焦于如何有效识别和纠正LLM在几何推理过程中产生的错误，从而推动几何问题自动求解技术的发展。H-GEO的出现填补了中文几何问题数据集的空白，对教育技术、自动推理及相关AI应用领域具有显著影响力。

当前挑战

H-GEO数据集面临的挑战主要体现在两个方面：领域问题方面，几何推理涉及复杂的空间关系和逻辑推导，LLM容易在推理链条中产生幻觉或逻辑断裂，如何精准定位错误并生成合理修正是核心难题；数据构建方面，需确保错误答案的多样性和代表性，同时提供高质量的修正方案，这对数据标注的准确性和一致性提出了极高要求。此外，图像与文本的协同标注增加了数据处理的复杂度，如何有效对齐多模态信息以支持模型训练是另一项关键挑战。

常用场景

经典使用场景

在几何推理领域，H-GEO数据集通过提供包含几何问题、大语言模型错误及其修正的中文文本和图像，为研究者提供了一个独特的资源。该数据集特别适用于微调大语言模型，以减少在几何推理过程中产生的幻觉现象。通过分析错误答案的推理和计算部分，研究者可以深入理解模型在几何问题上的常见错误模式，从而设计更有效的修正策略。

解决学术问题

H-GEO数据集解决了大语言模型在几何推理中常见的幻觉问题，即模型生成的答案看似合理但实际错误的现象。通过提供详细的错误分析和修正，该数据集帮助研究者识别和纠正模型在几何问题上的逻辑缺陷和计算错误。这不仅提升了模型在几何推理任务上的准确性，也为理解模型的推理机制提供了宝贵的数据支持。

实际应用

在实际应用中，H-GEO数据集可用于教育技术领域，例如开发智能辅导系统，帮助学生识别和纠正几何问题中的常见错误。此外，该数据集还可用于评估和改进大语言模型在几何推理任务上的性能，为模型优化提供实证依据。通过结合图像和文本数据，H-GEO为多模态学习提供了丰富的应用场景。

数据集最近研究