qwen3.5-functioncalling-v2

Hugging Face2026-03-07 更新2026-03-08 收录

下载链接：

https://huggingface.co/datasets/Mustafaege/qwen3.5-functioncalling-v2

下载链接

链接失效反馈

官方服务：

资源简介：

Qwen3.5 Function Calling Dataset v2 是一个扩展的函数调用监督微调（SFT）数据集，结合了 glaiveai/glaive-function-calling-v2 和 Saxo/alpaca_function_calling_dataset 的数据，并统一为 Qwen3 消息格式。该数据集在 v1 版本的基础上增加了双语（英语和韩语）指令多样性。数据集包含约 225,000 个样本，其中训练集约 202,000 个，测试集约 23,000 个。数据格式为 Qwen3 消息，包括 system、user 和 assistant 三种角色类型，适用于文本生成、工具使用和结构化输出等任务。数据集支持多轮对话和单轮指令，并提供了详细的示例和使用说明。

Qwen3.5 Function Calling Dataset v2 is an extended function calling supervised fine-tuning (SFT) dataset that combines data from glaiveai/glaive-function-calling-v2 and Saxo/alpaca_function_calling_dataset, and unifies them into the Qwen3 message format. Building on the v1 version, it has enhanced instruction diversity with bilingual (English and Korean) prompts. The dataset contains approximately 225,000 samples in total, with around 202,000 training samples and 23,000 test samples. The data follows the Qwen3 message format, which includes three role types: system, user, and assistant. It is suitable for tasks such as text generation, tool usage, and structured output generation. The dataset supports both multi-turn dialogues and single-turn instructions, and provides detailed examples and usage guidelines.

创建时间：

2026-03-07

原始信息汇总

Qwen3.5 Function Calling Dataset v2 数据集概述

数据集基本信息

数据集名称: Qwen3.5 Function Calling Dataset v2
许可证: Apache 2.0
语言: 英语、韩语
任务类别: 文本生成
标签: 函数调用、工具使用、SFT、聊天、qwen3、qwen3.5、指令遵循、结构化输出、json、微调、双语、韩语、开源、扩展数据集
规模类别: 100K<n<1M
注释创建者: 机器生成
语言创建者: 已有

数据集规模与划分

总样本数: 约225K
训练集划分: 约202K
测试集划分: 约23K

版本对比

版本	样本数	语言	新增数据源
v1	112,960	英语	glaiveai/glaive-function-calling-v2
v2	约225K	英语 + 韩语	+ Saxo/alpaca_function_calling_dataset

v2版本新增特性

双语支持: 从Saxo/alpaca数据集中添加了韩语函数调用示例。
更多样性: 从Llama 3指令格式转换的Alpaca格式指令。
更好覆盖: RAG风格函数调用、多步骤指令。
数据量翻倍: 约225K对比112K样本。

数据集结构

数据字段

字段	类型	描述
`messages`	`list[dict]`	包含`role`和`content`的对话轮次列表

角色类型

角色	描述
`system`	函数模式定义
`user`	用户请求或函数响应
`assistant`	函数调用JSON或自然语言回复

数据源

数据集	格式	样本数	关键特性
glaiveai/glaive-function-calling-v2	`system` + `chat`	112,960	多轮对话、函数响应
Saxo/alpaca_function_calling_dataset	`system` + `instruction` + `output`	约112,390	英语+韩语双语、RAG焦点

数据格式示例

标准多轮对话示例

json { "messages": [ {"role": "system", "content": "You are a helpful assistant with access to the following functions: { "name": "search_product", "description": "Search for a product in the database", "parameters": { "type": "object", "properties": { "query": {"type": "string", "description": "Search query"} }, "required": ["query"] } }"}, {"role": "user", "content": "Find me a blue winter jacket under $100"}, {"role": "assistant", "content": "<functioncall> {"name": "search_product", "arguments": {"query": "blue winter jacket under 100"}}"}, {"role": "user", "content": "FUNCTION RESPONSE: {"results": [{"name": "Alpine Jacket", "price": 89.99, "color": "blue"}]}"}, {"role": "assistant", "content": "I found a matching item: Alpine Jacket in blue for $89.99."} ] }

Alpaca风格单轮对话示例

json { "messages": [ {"role": "user", "content": "You are a helpful assistant with access to the following functions...

Convert 100 USD to EUR

Input: {"amount": 100, "from": "USD", "to": "EUR"}"}, {"role": "assistant", "content": "{"name": "currency_convert", "arguments": {"amount": 100, "from_currency": "USD", "to_currency": "EUR"}}"} ] }

使用方式

python from datasets import load_dataset dataset = load_dataset("Mustafaege/qwen3.5-functioncalling-v2")

许可证

Apache 2.0 — 详情见 https://www.apache.org/licenses/LICENSE-2.0

搜集汇总

数据集介绍

构建方式

在大型语言模型工具调用能力优化的背景下，Qwen3.5 Function Calling Dataset v2 的构建体现了数据整合与格式统一的工程思想。该数据集通过融合来自 glaiveai/glaive-function-calling-v2 和 Saxo/alpaca_function_calling_dataset 两个开源数据源的内容，构建了约22.5万个样本。构建过程涉及将原始数据统一转换为Qwen3消息格式，其中系统角色用于定义函数模式，用户与助理角色则分别承载自然语言请求、函数调用JSON及回复。这一过程不仅整合了多轮对话与单轮指令两种交互模式，还通过脚本将不同来源的数据结构进行了标准化处理，确保了数据格式的一致性，为模型监督式微调提供了结构化的高质量语料。

特点

该数据集的核心特点在于其双语覆盖与任务多样性。相较于前代版本，v2版本新增了韩语指令，形成了英语与韩语的双语支持，显著扩展了模型的跨语言工具调用能力。数据集内容涵盖了检索增强生成风格的多步骤函数调用、多样化指令场景，以及从Llama 3指令格式转换而来的丰富指令集，从而提升了任务覆盖的广度与深度。其数据格式严格遵循角色对话结构，清晰地区分了系统定义、用户输入和助理输出，为模型学习结构化输出提供了明确的范式。

使用方法

在具体应用层面，该数据集主要用于大型语言模型的监督式微调，以增强其函数调用与工具使用能力。研究人员可通过 Hugging Face `datasets` 库直接加载数据集，获得包含约20.2万训练样本和2.3万测试样本的数据分割。数据以消息列表的形式组织，便于直接用于基于Transformer架构的序列到序列训练。结合如Unsloth等高效训练框架，开发者可以配置训练参数，利用该数据集对Qwen3.5等模型进行微调，使模型学会根据系统定义的函数模式，将用户请求解析为规范的JSON函数调用，并处理函数返回结果以生成自然语言回复。

背景与挑战

背景概述

在大型语言模型向工具调用与结构化输出能力演进的背景下，Qwen3.5 Function Calling Dataset v2应运而生。该数据集由Mustafaege团队于近期构建，旨在为Qwen系列模型的监督微调提供高质量、多样化的指令遵循与函数调用数据。其核心研究问题聚焦于如何通过大规模、多语言、多格式的对话数据，有效提升模型对用户指令的理解、对预定义函数模式的准确调用，以及生成结构化JSON输出的能力。通过整合glaive-function-calling-v2与alpaca_function_calling_dataset两个知名开源资源，并统一为Qwen消息格式，该数据集显著增强了模型在复杂多轮对话和跨语言场景下的工具使用性能，对推动开源社区在智能体与工具集成领域的研究具有重要价值。

当前挑战

该数据集致力于解决函数调用这一核心领域问题，其挑战在于模型需精准理解自然语言指令，并将其映射到具有严格模式约束的JSON函数调用上，同时处理多轮对话中工具执行结果的反馈与后续决策。在构建过程中，挑战主要体现为异构数据源的融合与格式统一，需将不同结构（如Glaive的多轮对话格式与Alpaca的单指令格式）的原始数据无损转换为标准化的Qwen消息序列。此外，引入韩语数据以实现双语多样性，要求确保翻译与指令的语义一致性，并维持函数模式定义的准确性。数据规模的倍增也带来了质量筛选与噪声控制的复杂性，以确保最终数据集的纯净度与实用性。

常用场景

经典使用场景

在大型语言模型工具调用能力的研究中，Qwen3.5 Function Calling Dataset v2 为模型监督微调提供了核心训练资源。该数据集通过整合多源指令，构建了包含系统角色定义、用户查询、助手函数调用及自然语言回复的完整对话序列，精准模拟了真实世界中人机交互时模型需解析用户意图、选择并执行外部工具、再整合结果进行回复的复杂流程。其双语特性进一步扩展了模型在跨语言环境下的泛化能力，使其成为训练具备稳健工具使用能力语言模型的经典基准。

实际应用

在实际部署中，基于此数据集微调的模型能够无缝集成到各类智能助理与自动化系统中。例如，在客户服务场景，模型可调用产品数据库查询接口，精准回答用户关于商品价格、库存的咨询；在数据分析领域，模型能根据用户自然语言指令，自动生成并执行相应的数据查询或可视化代码。其支持的多轮对话与RAG式函数调用，使得模型能够处理如旅行规划、多步骤问题求解等复杂、长链条的任务，极大地增强了智能系统的实用性与交互深度。

衍生相关工作

围绕该数据集，衍生出了一系列推动工具调用领域发展的经典工作。它作为核心训练数据，支撑了Qwen3.5系列模型在函数调用能力上的持续优化与评测。同时，其整合的Glaive和Alpaca格式数据源，也启发了后续研究对多源、多格式指令数据进行统一化处理的方法探索。基于此数据集构建的评估协议与基准测试，进一步催生了针对模型工具使用准确性、鲁棒性及跨语言迁移能力的新颖评测框架与模型架构改进方案。

以上内容由遇见数据集搜集并总结生成