graph-reasoning-messages-11K

Name: graph-reasoning-messages-11K
Creator: LAMM: MIT Laboratory for Atomistic and Molecular Mechanics
Published: 2026-01-07 21:28:23
License: 暂无描述

Hugging Face2026-01-07 更新2026-01-08 收录

下载链接：

https://huggingface.co/datasets/lamm-mit/graph-reasoning-messages-11K

下载链接

链接失效反馈

官方服务：

资源简介：

Graph Reasoning (Messages) 是一个用于训练和评估语言模型中图原生/结构化推理行为的聊天消息集合。每个数据集项都是一个对话，表示为有序的 `{role, content}` 消息列表（OpenAI风格的聊天格式）。助手响应包含明确的中间结构（例如 `<think>`, `<brainstorm>`, `<graph>`, `<graph_json>`, `<patterns>`, `<synthesis>`），可用于监督图提取、结构化分解、推理跟踪格式化和从结构化工件中合成/回答基础。数据集为英文，标签包括科学、生物学和材料，适用于文本生成任务。

提供机构：

LAMM: MIT Laboratory for Atomistic and Molecular Mechanics

创建时间：

2026-01-07

原始信息汇总

Graph Reasoning (Messages) 数据集概述

数据集基本信息

数据集名称: Graph Reasoning (Messages)
发布者: LAMM MIT
发布日期: 2026年
许可证: Apache-2.0
语言: 英语 (en)
标签: 科学、生物学、材料学
规模类别: 10K<n<100K

数据集内容与结构

目的: 用于训练和评估语言模型中图原生/结构化推理行为的聊天消息集合。
数据格式: 每个数据项是一个表示为有序列表的对话，列表由 {role, content} 格式的消息组成（OpenAI风格的聊天格式）。
特征:
- messages: 一个列表，其中每个元素是一个包含 content (字符串) 和 role (字符串) 的对象。
- role 的可能值: "user", "assistant", 在某些样本中可能包含 "system" 或 "tool"。
数据量:
- 训练集 (train): 11,024 个样本。
- 总大小: 115,942,744 字节。
- 下载大小: 61,683,252 字节。

数据特点

助手响应结构: 助手回复包含显式的中间结构标记（例如 <think>, <brainstorm>, <graph>, <graph_json>, <patterns>, <synthesis>）。
监督用途: 这些结构可用于监督图提取、结构化分解、推理轨迹格式化以及从结构化产物中进行综合/答案落地。

预期用途

用于监督微调或训练扩散大语言模型，以学习结构化推理行为。
评估图提取的保真度（例如，<graph_json> 的存在/有效性）。
工具实验：将自然语言转换为图，再进行综合。

加载与使用

python from datasets import load_dataset ds = load_dataset("lamm-mit/graph-reasoning-messages-11K")

引用信息

bibtex @dataset{graph_reasoning_messages_11k, author = {LAMM MIT}, title = {Graph Reasoning Messages 11K}, year = {2026}, publisher = {Hugging Face}, note = {Dataset: lamm-mit/graph-reasoning-messages-11K} }

搜集汇总

数据集介绍

构建方式

在科学计算与人工智能交叉领域，图推理能力已成为语言模型处理复杂结构化任务的关键。Graph Reasoning Messages 11K数据集的构建，旨在通过模拟真实对话场景，为模型提供图结构与推理轨迹的监督信号。该数据集包含超过一万条对话样本，每条样本均以OpenAI风格的聊天格式组织，涵盖用户查询与助手回复的交互序列。助手的回复中嵌入了如<think>、<graph>、<graph_json>等结构化标签，这些标签不仅标注了推理的中间步骤，还显式地呈现了实体关系图的构建过程，从而为模型学习图提取与结构化分解提供了精确的监督数据。

特点

该数据集的核心特点在于其深度融合了自然语言对话与显式结构化表示。每条对话样本中的助手回复均包含多层次的结构化元素，例如思维链标签、实体关系图及其JSON序列化形式，这些元素共同构成了从问题分解到答案生成的完整推理轨迹。这种设计使得数据集不仅适用于传统的文本生成任务，更能支持图提取、结构化推理格式化以及基于图结构的答案合成等高级能力评估。数据集覆盖了科学、生物学与材料学等专业领域，确保了内容的多样性与复杂性，为模型在专业场景下的推理性能提供了丰富的测试基准。

使用方法

使用该数据集时，可通过Hugging Face的datasets库直接加载，并按照对话格式进行模型训练或评估。数据以消息列表的形式存储，每条消息包含角色与内容字段，用户可根据需要提取助手回复中的结构化标签，用于监督图提取或推理轨迹生成任务。例如，可解析<graph_json>标签内的JSON数据，构建实体关系图以验证模型的结构化输出能力。数据集适用于监督微调、图推理行为评估以及自然语言到图结构的转换实验，为研究语言模型的结构化推理提供了标准化的数据接口与评估框架。

背景与挑战

背景概述

在人工智能领域，推动语言模型超越传统文本生成、实现结构化与图式推理能力，已成为前沿研究的关键方向。Graph Reasoning (Messages) 11K数据集由麻省理工学院LAMM研究团队于2026年发布，旨在为训练和评估语言模型的图原生与结构化推理行为提供专门资源。该数据集包含超过一万条对话样本，采用OpenAI风格的聊天格式，每条样本均以有序的{角色, 内容}消息列表呈现。其核心研究问题聚焦于如何通过监督学习，使模型能够从自然语言中提取图结构、进行结构化分解、生成可解释的推理轨迹，并基于结构化中间产物进行综合与答案生成。这一工作对科学、生物学、材料学等领域的复杂问题求解具有重要影响力，为开发具备深度推理能力的下一代人工智能系统奠定了数据基础。

当前挑战

该数据集致力于解决语言模型在复杂领域（如科学、工程系统设计）中进行结构化推理与图知识表示的挑战。具体而言，其旨在应对如何将非结构化的自然语言描述，准确、一致地转化为显式的图结构（如节点与边），并引导模型遵循多步骤的推理逻辑（如头脑风暴、模式识别、综合）这一核心难题。在构建过程中，挑战同样显著：首先，需要设计能够覆盖广泛复杂场景、同时确保内部推理结构（如<think>、<graph_json>等标签）逻辑严谨且格式统一的高质量对话数据。其次，标注过程要求深入理解特定领域知识，以生成包含有效图关系和合成步骤的助理回复，这涉及高昂的专家知识成本和严格的质量控制。此外，确保数据规模与多样性之间的平衡，以支持模型泛化能力，也是构建时面临的实际挑战。

常用场景

经典使用场景

在人工智能与自然语言处理领域，图推理与结构化思维已成为提升模型复杂问题解决能力的关键方向。Graph Reasoning (Messages) 数据集通过提供包含明确中间结构标记的对话消息，为训练和评估语言模型的图原生推理行为提供了经典范例。该数据集常用于监督式微调，引导模型学习从自然语言中提取图结构、进行结构化分解以及生成基于图推理的合成回答，从而在科学、生物学和材料学等需要严谨逻辑的学科中，增强模型的可解释性与推理深度。

解决学术问题

该数据集直接应对了当前大语言模型在深层推理与结构化输出方面的核心挑战。它通过标注的思维链与图结构，解决了模型在复杂多步推理中容易产生的幻觉问题，促进了可验证推理轨迹的生成。在学术意义上，它推动了神经符号推理、知识图谱构建以及可解释人工智能的发展，为模型如何将非结构化文本转化为结构化知识并基于此进行综合判断提供了实证基础，从而在认知科学与计算语言学交叉领域产生了深远影响。

衍生相关工作

围绕该数据集衍生的经典工作主要集中在增强语言模型的推理架构与工具使用能力。例如，基于其格式开发的模型能够更精准地执行图提取任务，将自然语言描述转换为标准的图JSON表示。相关工作也探索了将此类结构化推理能力与外部工具（如知识库查询、计算引擎）相结合，构建能够进行多模态、多步骤规划的人工智能体。这些研究不仅验证了数据集中间结构监督的有效性，也进一步推动了面向科学发现和工程设计的智能辅助系统的演进。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集