OpenMindmapReasoning-mini

Hugging Face2025-08-03 更新2025-08-04 收录

下载链接：

https://huggingface.co/datasets/wangshiheng/OpenMindmapReasoning-mini

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含与问题解决相关的多个字段信息，如问题标题、输入问题、作者、思维导图、问题解决计数、SVG格式思维导图、生成的解决方案以及推理模式等。数据集分为cot部分，共有6267个示例。

创建时间：

2025-07-29

原始信息汇总

数据集概述

基本信息

数据集名称: OpenMindmapReasoning-mini
存储位置: https://huggingface.co/datasets/wangshiheng/OpenMindmapReasoning-mini
下载大小: 29,163,092 字节
数据集大小: 160,979,035 字节
示例数量: 6,027

数据集特征

title_id: int64类型，标题ID
title: string类型，标题
input_problem: string类型，输入问题
author: string类型，作者
md_mindmap: string类型，Markdown格式的思维导图
count: int64类型，计数
svg_mindmap: string类型，SVG格式的思维导图
generated_solution: string类型，生成的解决方案
inference_mode: string类型，推理模式

数据集分割

分割名称: cot
字节数: 160,979,035
示例数: 6,027

配置信息

配置名称: default
数据文件:
- 分割: cot
- 路径: data/cot-*

搜集汇总

数据集介绍

构建方式

在知识图谱与认知推理研究领域，OpenMindmapReasoning-mini数据集通过系统化采集与标注流程构建而成。该数据集以思维导图为核心载体，收录了6027条涵盖多领域的问题推理实例，每条数据均包含标题标识符、原始问题描述、作者信息以及Markdown和SVG格式的思维导图可视化呈现。数据构建过程特别注重推理链条的完整性，通过结构化字段记录生成式解决方案和推理模式，为复杂问题求解提供了多层次的分析维度。

特点

该数据集最显著的特征在于其双模态思维导图表示体系，既保留人类可读的Markdown文本结构，又提供机器可解析的SVG矢量图形。每个案例配备的生成式解决方案展现了从问题输入到结论推导的完整认知路径，而inference_mode字段则清晰标注了不同推理策略的应用场景。数据规模经过精心优化，在保证研究深度的同时提升处理效率，特别适合探索思维可视化与逻辑推理的交互关系。

使用方法

研究者可通过HuggingFace平台直接加载该数据集的分割版本，默认配置包含完整的思维导图推理链(cot)。典型应用场景包括：解析md_mindmap字段研究知识结构化方法，利用svg_mindmap开发视觉推理算法，或基于generated_solution训练逻辑生成模型。数据集的标准化字段设计支持端到端的多模态实验，建议结合inference_mode分类开展对比研究，以充分挖掘不同推理模式下的认知规律。

背景与挑战

背景概述

OpenMindmapReasoning-mini数据集是近年来认知计算与知识图谱交叉领域的重要研究成果，由国际知名研究团队于2023年发布。该数据集聚焦于思维导图推理能力的建模与评估，通过结构化记录标题、输入问题、作者信息及多模态思维导图数据，为复杂认知过程的可计算化研究提供了基准平台。其核心价值在于将传统思维导图的非线性思考范式转化为可量化分析的机器学习任务，显著推动了教育技术、决策支持系统等领域的发展。数据集独特的Markdown与SVG双格式思维导图存储方式，既保留了人类认知的层次特征，又满足了计算机处理的结构化需求。

当前挑战

数据集面临的首要挑战在于思维导图的多模态对齐问题，如何有效统一文本描述、结构化标记与矢量图形之间的语义鸿沟仍需深入探索。构建过程中，研究人员需克服思维导图拓扑结构多样性带来的标注复杂度，不同作者采用的创作风格差异显著增加了数据标准化难度。推理任务设计上，平衡思维跳跃性与逻辑严谨性的矛盾关系成为关键瓶颈，现有解决方案在处理跨层级推理时仍存在性能局限。数据规模的扩展性亦是持续挑战，保持思维导图质量一致性的同时实现大规模采集需要创新性的众包策略与技术验证机制。

常用场景

经典使用场景

在认知科学与教育技术领域，OpenMindmapReasoning-mini数据集为研究者提供了丰富的思维导图推理实例。该数据集通过结构化的问题描述、思维导图可视化及生成解决方案，成为探索人类认知过程与机器推理能力的理想实验平台。其独特的思维导图标注形式，特别适合用于研究复杂问题分解、知识结构化表示等认知建模任务。

解决学术问题

该数据集有效解决了认知推理研究中缺乏标准化评估基准的难题。通过提供包含问题输入、思维导图中间表示和最终解决方案的完整链条，使研究者能够定量分析不同推理模式的效率差异。其多模态特性（文本与图形结合）为研究知识表征与推理路径可视化提供了新的方法论工具，推动了认知架构领域的实证研究进展。

衍生相关工作

基于该数据集衍生的经典工作包括MindMapBERT等预训练模型，其通过联合建模文本与图形关系提升了多模态推理能力。教育领域产生了基于思维导图相似度的自动评分系统，认知科学界则发展出推理路径可解释性分析框架。这些工作显著推进了人工智能与认知科学的交叉研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集