APIGen-MT-300-Next-Action

Hugging Face2025-11-03 更新2025-11-04 收录

下载链接：

https://huggingface.co/datasets/amityco/APIGen-MT-300-Next-Action

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了会话信息、答案信息、工具信息等。会话信息包括对话内容、参与者名称、角色和工具调用。工具调用包括函数名称、参数和类型。答案信息包括角色、工具调用和答案ID。工具信息包括工具描述、名称和参数信息，其中参数信息又包括参数描述和类型。数据集还包含了数据划分，分为训练集和测试集。

创建时间：

2025-10-24

原始信息汇总

APIGen-MT-300-Next-Action 数据集概述

数据集基本信息

数据集名称: APIGen-MT-300-Next-Action
总数据量: 400条样本
训练集: 300条样本
测试集: 100条样本
数据集大小: 9,941,966字节
下载大小: 1,093,377字节

数据结构特征

数据集包含以下主要字段：

对话记录 (conversations)

内容 (content): 字符串类型
名称 (name): 字符串类型
角色 (role): 字符串类型
工具调用 (tool_calls): 列表类型
- 函数 (function): 结构体
  - 参数 (arguments): 字符串类型
  - 名称 (name): 字符串类型
- 类型 (type): 字符串类型

回答 (answer)

角色 (role): 字符串类型
工具调用 (tool_calls): 列表类型
- 函数 (function): 结构体
  - 参数 (arguments): 字符串类型
  - 名称 (name): 字符串类型
- ID (id): 字符串类型
- 类型 (type): 字符串类型

工具定义 (tools)

描述 (description): 字符串类型
名称 (name): 字符串类型
参数 (parameters): 复杂结构体
- 包含多种属性字段（地址、金额、日期、航班信息等）
- 定义必需参数和参数类型

系统提示 (system_prompt)

数据类型: 字符串

数据处理说明

轨迹数据来源于APIGen-MT，筛选长度在25到32之间的样本
移除思考工具
随机分割最后0-3个索引的工具调用作为答案

搜集汇总

数据集介绍

构建方式

在API调用轨迹生成领域，APIGen-MT-300-Next-Action数据集通过精心设计的筛选机制构建而成。原始轨迹数据经过长度过滤，仅保留对话轮次在25至32之间的样本，确保对话深度适中。构建过程中移除了思维工具类调用，并采用随机截取策略，将最后0-3个工具调用作为预测目标，这种设计有效模拟了真实场景中连续API调用的决策过程。

特点

该数据集呈现出多维度结构化特征，涵盖航班预订、支付管理、用户信息等丰富领域。每个样本包含完整的对话历史、工具定义及系统提示，工具调用参数采用严格的JSON Schema规范定义，确保数据类型和枚举值的准确性。数据集规模包含300个训练样本和100个测试样本，其精心设计的工具调用轨迹为研究连续决策任务提供了高质量基准。

使用方法

研究者可利用该数据集训练和评估下一代动作预测模型，通过输入对话历史和可用工具定义，模型需准确预测后续工具调用序列。数据集的标准化格式支持端到端训练，系统提示字段为模型提供任务上下文，而工具参数的结构化定义则确保了生成结果的规范性。测试集专门用于评估模型在未见场景下的泛化能力，为API调用预测研究提供可靠验证平台。

背景与挑战

背景概述

APIGen-MT-300-Next-Action数据集聚焦于多轮对话系统中工具调用与动作预测的前沿研究，旨在模拟真实世界API交互场景。该数据集通过结构化对话轨迹构建，涵盖航班预订、支付处理、用户信息管理等复杂任务，反映了智能助手领域对精准动作序列生成的迫切需求。其设计融合了工具调用参数验证与动态上下文建模，为推进对话系统在开放域环境中的实用化进程提供了关键数据支撑。

当前挑战

该数据集需解决多轮对话中长序列依赖与工具调用准确性的核心难题，具体包括动态上下文下API参数匹配的歧义消除、跨领域工具功能组合的泛化能力提升。构建过程中面临对话轨迹长度筛选与思维工具剔除的平衡挑战，需确保动作序列在25至32步间的逻辑连贯性，同时通过随机分割策略模拟真实交互中未完成工具调用的补全场景。

常用场景

经典使用场景

在对话系统与工具调用融合研究领域，APIGen-MT-300-Next-Action数据集为多轮对话中的工具调用行为预测提供了标准化测试平台。该数据集通过精心设计的对话轨迹，模拟真实场景下用户与智能助手之间的交互过程，特别关注工具调用序列的连贯性与合理性。研究者可利用其结构化对话记录，训练模型理解复杂对话上下文，并准确预测下一步应当执行的工具操作。

实际应用

在智能客服与虚拟助手开发实践中，APIGen-MT-300-Next-Action数据集支撑了下一代对话系统的功能升级。基于该数据集训练的模型能够准确理解用户在多轮对话中的复杂需求，自动调用预订系统、支付接口、信息查询等外部工具完成实际任务。这种能力显著提升了电商平台、旅行预订、金融服务等领域的自动化服务水平，实现了从基础问答到任务执行的跨越。

衍生相关工作

围绕该数据集衍生的经典研究主要集中在工具增强型语言模型的架构创新方面。研究者基于其提供的标准化测试环境，开发了多种工具调用预测模型和对话状态跟踪算法。这些工作不仅推动了Toolformer、Gorilla等工具调用框架的发展，还催生了对话系统中工具使用评估指标体系的建立，为后续工具学习研究奠定了方法论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集