n8n-Toolkit

Hugging Face2026-01-04 更新2026-01-05 收录

下载链接：

https://huggingface.co/datasets/DavidrPatton/n8n-Toolkit

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在微调Qwen3-VL-4B（或类似视觉语言模型）成为商业自动化架构师，能够设计n8n工作流程、理解工作流程截图并进行解释、进行复杂自动化任务的链式思考推理以及进行多轮对话优化和调试。数据集包含三个配置：vision（工作流程截图和描述）、sharegpt（多轮对话格式）和thinking（链式思考推理三元组）。数据集覆盖了50多个平台和集成，包括工作流程自动化核心、AI和LLM平台、RAG和向量数据库、商业平台、通信和消息、社交媒体、数据库和存储、浏览器自动化和测试、开发者工具、电子商务和支付、数据格式和处理、媒体和多模态等多个领域。

This dataset is designed to fine-tune Qwen3-VL-4B (or similar vision-language models) into commercial automation architects, who are capable of designing n8n workflows, understanding and explaining workflow screenshots, performing chain-of-thought reasoning for complex automation tasks, as well as conducting multi-turn dialogue optimization and debugging. The dataset includes three configurations: vision (workflow screenshots and descriptions), sharegpt (multi-turn dialogue format), and thinking (chain-of-thought reasoning triples). The dataset covers over 50 platforms and integrations across multiple domains, including core workflow automation, AI and LLM platforms, RAG and vector databases, business platforms, communication and messaging, social media, databases and storage, browser automation and testing, developer tools, e-commerce and payment, data formatting and processing, media and multimodal, and more.

创建时间：

2026-01-04

原始信息汇总

n8n-Toolkit 数据集概述

基本信息

数据集名称: n8n-Toolkit
创建者: DavidrPatton
许可证: Apache 2.0
主要任务类别: 视觉问答、文本生成
语言: 英语
标签: n8n、自动化、工作流、qwen3-vl
规模: 10K<n<100K
总数据量: 16,088 个示例，约 229 MB

数据集配置

数据集包含三个独立的配置：

配置名称	示例数量	数据大小	格式	描述
vision	2,274	194 MB	包含嵌入图像的 Parquet 文件	工作流截图与描述
sharegpt	10,827	25 MB	Parquet 文件	多轮对话格式
thinking	2,987	10 MB	Parquet 文件	思维链推理三元组
default	2,274	194 MB	Parquet 文件	默认配置，指向 vision 数据

设计目的

该数据集旨在将 Qwen3-VL-4B 或类似的视觉语言模型微调为 业务自动化架构师，使其具备以下能力：

根据自然语言描述设计 n8n 工作流。
理解工作流截图并解释其功能。
对复杂的自动化任务进行思维链推理。
围绕工作流优化和调试进行多轮对话。

数据内容覆盖范围

数据集涵盖 50+ 个平台和集成 的训练数据。

核心自动化技术

n8n: 超过 21,400 次提及，完整的工作流自动化平台覆盖。
工作流设计: 超过 20,200 次提及。
自动化模式: 超过 12,400 次提及。
API 集成: 超过 11,200 次提及。
Webhooks: 超过 7,300 次提及。

AI 与 LLM 平台

包括 OpenAI/GPT、LangChain、AI Agents、Qwen、Gemini、Anthropic/Claude、LLaMA、Mistral、Dify、CrewAI、AutoGen、LlamaIndex、LangGraph 等。

RAG 与向量数据库

包括 RAG 管道、Embeddings、Pinecone、Qdrant、Weaviate 等。

业务平台

包括 Google Workspace、HubSpot、Salesforce、Pipedrive、Odoo、GoHighLevel 等。

通信与消息平台

包括 Slack、Discord、Telegram、WhatsApp、Email、Mattermost、Twilio 等。

社交媒体平台

包括 Twitter/X、LinkedIn、Facebook、Instagram、YouTube 等。

数据库与存储

包括 PostgreSQL、MySQL、MongoDB、Redis、Supabase、Firebase、Airtable、Notion 等。

浏览器自动化与测试

包括 Puppeteer、Playwright、Selenium、Cypress、Web Scraping 等。

开发者工具

包括 GitHub、Docker、AWS、React、HTTP/REST、OAuth、JSON Processing 等。

电子商务与支付

包括 Stripe、Shopify、WooCommerce、WordPress 等。

数据格式与处理

包括 JSON、Excel、HTML、PDF、CSV、XML、Markdown 等。

媒体与多模态

包括 Vision/Images、Video、Audio、Multimodal AI 等。

配置详情

Vision 配置（默认）

包含带有嵌入图像的工作流截图，用于视觉语言训练。

字段:

id: 字符串，唯一工作流标识符。
image: 图像，n8n 工作流的嵌入式 PNG 截图。
description: 字符串，工作流的自然语言描述。
workflow_json: 字符串，n8n 工作流的完整 JSON 表示。
node_count: 整数，工作流中的节点数量。
source: 字符串，数据来源。

图像来源: 所有 2,274 个示例均包含高分辨率 n8n 工作流编辑器截图，显示完整的工作流画布、节点和连接。

ShareGPT 配置

包含标准 ShareGPT 格式的多轮对话，用于指令微调。

字段:

conversations: 字符串（JSON），{from, value} 对话轮次数组。
category: 字符串，工作流类别。
domain: 字符串，业务领域。
complexity: 字符串，难度级别。
instruction: 字符串，任务指令。
input: 字符串，用户输入/上下文。
output: 字符串，预期响应。

类别分布: 主要类别包括 General Automation (25.2%)、Automation Framework (27.3%)、Data Processing (2.1%)、Code Implementation (1.4%)、UI Documentation (1.2%) 等。

Thinking 配置

包含思维链推理三元组，用于训练审慎推理能力。

字段:

prompt: 字符串，任务描述或用户请求。
json: 字符串，生成的 n8n 工作流 JSON。
thinking: 字符串，逐步推理过程。

思维过程结构: 包括问题分析、节点选择、配置推理、连接逻辑和边缘情况考虑。

使用方式

加载数据集

python from datasets import load_dataset vision_ds = load_dataset("DavidrPatton/n8n-Toolkit", "vision") sharegpt_ds = load_dataset("DavidrPatton/n8n-Toolkit", "sharegpt") thinking_ds = load_dataset("DavidrPatton/n8n-Toolkit", "thinking")

访问 Vision 数据

python ds = load_dataset("DavidrPatton/n8n-Toolkit", "vision", split="train") example = ds[0]

解析 ShareGPT 对话

python import json ds = load_dataset("DavidrPatton/n8n-Toolkit", "sharegpt", split="train") example = ds[0] conversations = json.loads(example[conversations])

训练指导

兼容的训练框架

Unsloth
Axolotl
LLaMA-Factory
Hugging Face TRL

数据格式与结构

文件结构

n8n-Toolkit/ ├── vision/ │ └── train-00000-of-00001.parquet ├── sharegpt/ │ └── train-00000-of-00001.parquet └── thinking/ └── train-00000-of-00001.parquet

n8n 工作流 JSON 模式

遵循官方 n8n 工作流格式，包含 name、nodes、connections、active 等字段。

统一版本

如需一次性训练所有数据，可使用预合并和格式化的统一版本：DavidrPatton/n8n-toolkit-combined (https://huggingface.co/datasets/DavidrPatton/n8n-toolkit-combined)。

搜集汇总

数据集介绍

构建方式

在自动化工作流领域，n8n-Toolkit数据集的构建体现了多模态与结构化数据的深度融合。该数据集通过三个精心设计的配置模块进行系统化采集：vision配置整合了2,274个包含嵌入式图像的工作流截图与对应JSON描述，实现视觉与文本的精准对齐；sharegpt配置基于10,827条多轮对话数据，模拟真实业务场景下的交互式需求分析；thinking配置则收录2,987组链式思维推理三元组，揭示复杂工作流设计的逻辑推演过程。所有数据均采用标准化Parquet格式存储，并通过质量过滤确保技术描述的准确性与一致性。

使用方法

针对不同训练目标，使用者可通过Hugging Face datasets库灵活加载特定配置模块。vision配置需配合视觉编码器处理嵌入式工作流截图，实现从图像到结构化JSON的跨模态映射；sharegpt配置建议采用指令微调框架，通过解析多轮对话的JSON序列模拟真实业务咨询场景；thinking配置适用于思维链增强训练，可利用三元组结构构建“问题-推理-解决方案”的递进学习范式。训练过程中推荐集成Unsloth等高效微调工具，针对Qwen3-VL等视觉语言模型适配LoRA参数优化策略，并依据业务场景需求进行多配置混合训练，以全面提升模型在自动化架构设计领域的综合能力。

背景与挑战

背景概述

随着企业数字化转型的深入，自动化工作流设计成为提升运营效率的关键技术。n8n-Toolkit数据集应运而生，旨在将视觉语言模型如Qwen3-VL训练为业务自动化架构师。该数据集由David Patton等研究人员构建，发布于2024年，专注于解决从自然语言描述或工作流截图自动生成n8n工作流的核心研究问题。它涵盖了超过50个平台与集成技术，包含视觉理解、多轮对话和思维链推理三大子集，共计16,088个样本，为多模态人工智能在自动化领域的应用提供了高质量的训练资源，显著推动了智能工作流设计技术的发展。

当前挑战

该数据集旨在解决业务自动化工作流设计的复杂挑战，其核心问题在于如何让模型理解跨平台集成逻辑、可视化工作流结构，并进行多步骤推理。具体挑战包括：模型需从自然语言或截图中精准解析节点连接、参数配置及数据流逻辑；同时需处理多模态对齐，即将视觉信息与结构化JSON工作流准确关联。在构建过程中，挑战集中于大规模高质量数据的合成，例如生成涵盖多样业务场景的真实工作流截图，以及确保思维链数据具备逻辑连贯性，避免生成错误或矛盾的自动化模式。

常用场景

经典使用场景

在自动化工作流设计领域，n8n-Toolkit数据集为多模态大语言模型提供了精细调优的宝贵资源。该数据集通过整合视觉、对话与推理三大模块，构建了从自然语言描述到可视化工作流设计的完整映射。其经典应用场景在于训练模型理解n8n平台的工作流截图，将图像信息与结构化JSON数据相结合，使模型能够根据用户需求自动生成或优化复杂的业务流程自动化方案。这种能力在需要快速原型设计和跨平台集成的企业环境中具有重要价值。

解决学术问题

该数据集有效解决了多模态人工智能在专业领域应用中的若干关键学术问题。首先，它通过视觉-语言对齐技术，攻克了从工作流图像到语义理解的跨模态表征难题。其次，数据集中的链式思维推理样本为复杂决策过程提供了可解释性研究基础，有助于探索模型在自动化架构设计中的逻辑推演能力。此外，多轮对话数据为研究人机协作交互模式提供了实证材料，推动了领域特定对话系统的演进。这些贡献显著提升了AI在专业工具辅助设计方面的学术研究深度。

实际应用

在实际商业环境中，n8n-Toolkit数据集支撑的模型能够转化为高效的业务自动化架构师。企业可利用此类模型快速构建跨平台集成方案，例如将CRM系统与邮件营销流程自动衔接，或设计基于实时数据的智能报告生成工作流。在具体实施中，模型能够分析现有工作流截图并提出优化建议，降低了对专业开发人员的依赖。这种能力特别适用于中小型企业数字化转型场景，使得复杂的技术集成通过自然语言交互即可实现，大幅提升了业务流程自动化部署的效率与灵活性。

数据集最近研究

用例	配置	说明
视觉语言微调	`vision`	训练模型理解工作流截图
指令微调	`sharegpt`	通用 n8n 知识和对话能力
推理增强	`thinking`	复杂工作流设计的思维链
完整业务架构师	全部三个	完整能力覆盖