WorkflowLLM
收藏Hugging Face2025-03-11 更新2025-03-12 收录
下载链接:
https://huggingface.co/datasets/openbmb/WorkflowLLM
下载链接
链接失效反馈官方服务:
资源简介:
WorkflowLLM是一个用于增强大型语言模型在工作流编排方面能力的数据驱动框架。该框架的核心是WorkflowBench数据集,包含106,763个工作流样本,跨越1,503个API和28个类别的83个应用程序。
WorkflowLLM is a data-driven framework designed to enhance the workflow orchestration capabilities of large language models. The core of this framework is the WorkflowBench dataset, which contains 106,763 workflow samples spanning 83 applications across 1,503 APIs and 28 categories.
提供机构:
OpenBMB
创建时间:
2025-03-11
搜集汇总
数据集介绍

构建方式
WorkflowLLM数据集是以数据为中心的框架,旨在提升大型语言模型在工作流编排方面的能力。其核心为WorkflowBench,这是一个大规模的监督微调数据集,包含106,763个样本,跨越83个应用程序中的1,503个API,涵盖28个类别。该数据集的构建采用真实世界的数据转录和合成数据生成两种方式,前者作为构建或增强数据集的种子数据,后者用于增加数据集的规模和多样性,确保模型具有更好的泛化能力。
使用方法
使用WorkflowLLM数据集时,研究者可以依据dataset_split_keys.json和dataset_split_keys_ood.json文件来划分训练和测试数据。identifier2json.pkl和identifier2python.pkl文件可用于访问API的详细描述。seed_data.json和synthesized_data.json文件则提供了数据集的主体内容。statistics.pkl文件包含了数据集的统计信息,有助于了解数据集的结构和分布。
背景与挑战
背景概述
WorkflowLLM数据集,诞生于2024年,由Fan Shengda等研究人员精心构建,旨在提升大型语言模型在工作流编排领域的应用能力。该数据集以WorkflowBench为核心,是一个大规模的有监督微调数据集,包含了106,763个工作流样本,涵盖83个应用程序中的1,503个API,横跨28个不同类别。其研究成果为工作流自动化和智能编排领域提供了重要的数据支撑,推动了相关技术的发展和应用。
当前挑战
该数据集面临的挑战主要涉及两个方面:一是如何处理未见过的新指令,即分布内(ID)的指令,这对于模型的泛化能力提出了挑战;二是如何应对未见过的新API,即分布外(OOD)的API,这对于模型的适应性和鲁棒性提出了更高的要求。在构建过程中,数据集的多样性和质量保证也是必须克服的重要挑战,以确保模型能在多样化的工作流编排任务中表现良好。
常用场景
经典使用场景
在当前人工智能技术发展的大背景下,WorkflowLLM数据集以其独特的视角,专注于提升大型语言模型在流程编排方面的能力。该数据集的核心是WorkflowBench,一个大规模的有监督微调数据集,包含106,763个样本,跨越83个应用程序的1,503个API,分布在28个类别中。其经典的使用场景主要在于对大型语言模型进行微调,以适应复杂的API调用和工作流程编排任务。
解决学术问题
WorkflowLLM数据集解决了传统大型语言模型在处理工作流编排任务时的泛化能力不足问题。通过提供丰富多样的API调用和工作流程实例,该数据集助力研究者深入探讨模型在处理未知指令和API时的性能表现,从而推动大型语言模型在实践应用中的稳定性和可靠性。
实际应用
在实际应用中,WorkflowLLM数据集的应用范围广泛。它不仅可以用于优化自动化工作流程,还可以在软件开发、任务调度、自动化测试等领域发挥重要作用。例如,开发者可以利用该数据集训练出的模型来自动化复杂的软件部署流程,或是优化现有的工作流程管理系统。
数据集最近研究
最新研究方向
WorkflowLLM数据集近期聚焦于提升大型语言模型在工作流编排领域的应用能力。该数据集通过其核心组件WorkflowBench,提供了一个大规模的监督微调数据集,包含106,763个样本,跨越83个应用程序的1,503个API,并涵盖28个类别。研究旨在探索模型对未见指令和API的处理能力,为工作流自动化和智能化提供新的视角。通过引入分布内和分布外的数据划分,以及API文档的索引,该研究不仅促进了模型的泛化能力,也为理解和优化大型语言模型在复杂任务中的应用提供了重要参考。
以上内容由遇见数据集搜集并总结生成



