five

GraphThought

收藏
arXiv2025-02-17 更新2025-02-27 收录
下载链接:
http://arxiv.org/abs/2502.11607v1
下载链接
链接失效反馈
官方服务:
资源简介:
GraphThought是一个新颖的框架,设计用于图组合优化问题,通过推理思维生成来微调大型语言模型。该框架由两个核心模块组成:选择器和构造器,它们协作生成特定任务的推理程序。GraphThought框架利用前向和后向元思维编程方法来获取算法知识,分别编码显式算法知识和隐式问题解决模式。该数据集是针对图组合优化问题设计的,旨在提高大型语言模型解决复杂任务时的推理和规划能力。

GraphThought is a novel framework tailored for graph combinatorial optimization problems, which fine-tunes large language models (LLMs) through generative reasoning thought processes. The framework comprises two core modules: a selector and a constructor, which collaborate to generate task-specific reasoning procedures. The GraphThought framework utilizes forward and backward meta-thinking programming methodologies to acquire algorithmic knowledge, where the former encodes explicit algorithmic knowledge and the latter encodes implicit problem-solving patterns. This dataset is designed for graph combinatorial optimization problems, with the goal of enhancing the reasoning and planning capabilities of LLMs when addressing complex tasks.
提供机构:
华东师范大学计算机科学与技术学院
创建时间:
2025-02-17
搜集汇总
数据集介绍
main_image_url
构建方式
GraphThought数据集的构建基于一种新颖的框架,旨在生成高质量的思维数据集以解决图组合优化(GCO)问题。该框架首先定义了最优思维设计(OTD)问题,包括其状态和动作思维空间。然后,通过使用这些数据集,对Llama-3-8B-Instruct模型进行微调,开发了Llama-GT模型。Llama-GT模型具有紧凑的8B参数架构,但在GraphArena基准测试中表现与最先进的LLM相当。
特点
GraphThought数据集的特点在于其能够生成高质量的思维数据集,这些数据集有助于LLM解决GCO问题。此外,Llama-GT模型在GraphArena基准测试中的表现优于其他LLM模型,甚至接近商业求解器Gurobi的性能。
使用方法
GraphThought数据集的使用方法是通过微调LLM模型,使其能够生成高质量的思维数据集,这些数据集可以帮助LLM解决GCO问题。用户可以使用GraphThought框架中的 Selector 和 Constructor 模块来生成特定任务的推理程序,并通过迭代执行这些程序来产生推理思维集。最后,使用这些推理思维集对LLM进行微调,以提升其解决GCO问题的能力。
背景与挑战
背景概述
GraphThought 数据集由华东师范大学计算机科学与技术学院、数学科学学院等机构的研究人员于2025年提出,旨在解决大型语言模型(LLM)在处理图组合优化(GCO)问题上的局限性。该数据集的核心研究问题是定义了最优思想设计(OTD)问题,包括其状态和动作思想空间。GraphThought 框架的引入旨在生成高质量的 GCO 问题思想数据集,并通过这些数据集微调 Llama-3-8B-Instruct 模型,开发了 Llama-GT 模型。Llama-GT 模型在 GraphArena 基准测试中表现出色,即使其架构仅包含 8B 参数,也能匹配最先进的 LLM 性能。GraphThought 数据集的提出对相关领域产生了深远的影响,为 LLM 在复杂问题解决和逻辑推理方面的应用提供了新的思路和方法。
当前挑战
GraphThought 数据集面临的挑战主要包括:1) LLM 在处理 GCO 问题的能力有限,难以解决复杂的优化问题;2) 构建过程中,如何将启发式算法的搜索原则融入 LLM 的输出过程,以提高模型性能;3) 如何设计通用的思想表示和生成方法,以适应不同类型的 GCO 问题。此外,GraphThought 框架在处理 NP-hard 或 NP-complete 问题时的思想生成方法也存在一定的挑战,因为这些问题没有有效的传统(启发式)搜索方法。
常用场景
经典使用场景
GraphThought数据集主要用于图组合优化问题(GCO),旨在通过生成高质量的思想数据集来提升大型语言模型(LLMs)在解决GCO问题上的能力。该数据集的生成框架GraphThought包括前向和反向思维生成方法,用于解决简单和复杂的GCO问题。GraphThought框架已被用于微调Llama-3-8B-Instruct模型,以开发Llama-GT,该模型在GraphArena基准测试中表现出色,甚至优于一些商业求解器。
衍生相关工作
GraphThought数据集的提出对相关领域的研究产生了深远的影响。GraphThought框架的设计理念和方法已经被广泛应用于LLMs在解决GCO问题上的研究。此外,GraphThought数据集还衍生了其他相关工作,如GraphArena基准测试和Llama-GT模型等,这些工作进一步推动了LLMs在解决GCO问题上的研究和应用。
数据集最近研究
最新研究方向
GraphThought数据集的研究方向主要集中在利用大型语言模型(LLMs)解决图组合优化(GCO)问题。GraphThought框架通过生成高质量的思考数据集,为LLMs提供了解决GCO问题的能力。该框架包括正向和反向元思考编程(MTP)方法,用于生成思考数据集,并通过这些数据集微调LLMs。实验结果表明,GraphThought框架在GraphArena基准测试中取得了最先进的性能,证明了LLMs在解决GCO问题方面的潜力。GraphThought的研究方向对于推动LLMs在复杂任务中的推理和规划能力具有重要意义,并为LLMs在解决GCO问题方面的未来研究提供了新的思路。
相关研究论文
  • 1
    GraphThought: Graph Combinatorial Optimization with Thought Generation华东师范大学计算机科学与技术学院 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作