qwen3.5-functioncalling-v2
收藏Qwen3.5 Function Calling Dataset v2 数据集概述
数据集基本信息
- 数据集名称: Qwen3.5 Function Calling Dataset v2
- 许可证: Apache 2.0
- 语言: 英语、韩语
- 任务类别: 文本生成
- 标签: 函数调用、工具使用、SFT、聊天、qwen3、qwen3.5、指令遵循、结构化输出、json、微调、双语、韩语、开源、扩展数据集
- 规模类别: 100K<n<1M
- 注释创建者: 机器生成
- 语言创建者: 已有
数据集规模与划分
- 总样本数: 约225K
- 训练集划分: 约202K
- 测试集划分: 约23K
版本对比
| 版本 | 样本数 | 语言 | 新增数据源 |
|---|---|---|---|
| v1 | 112,960 | 英语 | glaiveai/glaive-function-calling-v2 |
| v2 | 约225K | 英语 + 韩语 | + Saxo/alpaca_function_calling_dataset |
v2版本新增特性
- 双语支持: 从Saxo/alpaca数据集中添加了韩语函数调用示例。
- 更多样性: 从Llama 3指令格式转换的Alpaca格式指令。
- 更好覆盖: RAG风格函数调用、多步骤指令。
- 数据量翻倍: 约225K对比112K样本。
数据集结构
数据字段
| 字段 | 类型 | 描述 |
|---|---|---|
messages |
list[dict] |
包含role和content的对话轮次列表 |
角色类型
| 角色 | 描述 |
|---|---|
system |
函数模式定义 |
user |
用户请求或函数响应 |
assistant |
函数调用JSON或自然语言回复 |
数据源
| 数据集 | 格式 | 样本数 | 关键特性 |
|---|---|---|---|
| glaiveai/glaive-function-calling-v2 | system + chat |
112,960 | 多轮对话、函数响应 |
| Saxo/alpaca_function_calling_dataset | system + instruction + output |
约112,390 | 英语+韩语双语、RAG焦点 |
数据格式示例
标准多轮对话示例
json { "messages": [ {"role": "system", "content": "You are a helpful assistant with access to the following functions: { "name": "search_product", "description": "Search for a product in the database", "parameters": { "type": "object", "properties": { "query": {"type": "string", "description": "Search query"} }, "required": ["query"] } }"}, {"role": "user", "content": "Find me a blue winter jacket under $100"}, {"role": "assistant", "content": "<functioncall> {"name": "search_product", "arguments": {"query": "blue winter jacket under 100"}}"}, {"role": "user", "content": "FUNCTION RESPONSE: {"results": [{"name": "Alpine Jacket", "price": 89.99, "color": "blue"}]}"}, {"role": "assistant", "content": "I found a matching item: Alpine Jacket in blue for $89.99."} ] }
Alpaca风格单轮对话示例
json { "messages": [ {"role": "user", "content": "You are a helpful assistant with access to the following functions...
Convert 100 USD to EUR
Input: {"amount": 100, "from": "USD", "to": "EUR"}"}, {"role": "assistant", "content": "{"name": "currency_convert", "arguments": {"amount": 100, "from_currency": "USD", "to_currency": "EUR"}}"} ] }
使用方式
python from datasets import load_dataset dataset = load_dataset("Mustafaege/qwen3.5-functioncalling-v2")
相关数据集
| 版本 | 样本数 | 语言 | 链接 |
|---|---|---|---|
| v1 | 112,960 | 英语 | https://huggingface.co/datasets/Mustafaege/qwen3.5-functioncalling-v1 |
| v2 | 约225K | 英语 + 韩语 | https://huggingface.co/datasets/Mustafaege/qwen3.5-functioncalling-v2 |
许可证
Apache 2.0 — 详情见 https://www.apache.org/licenses/LICENSE-2.0



