Quest-SFT-Data-Open-ended
收藏Hugging Face2026-05-21 更新2026-05-22 收录
下载链接:
https://huggingface.co/datasets/osunlp/Quest-SFT-Data-Open-ended
下载链接
链接失效反馈官方服务:
资源简介:
QUEST SFT 数据(开放式)是一个用于监督微调(SFT)的数据集,专门针对工具使用助手(tool-using assistant)格式设计。该数据集仅包含训练集(split: train)。数据以对话轨迹的形式组织,核心列是 messages,其内容是一个由字典组成的列表,每个字典包含 role(角色)和 content(内容)两个字段,这通常对应于多轮人机交互或指令遵循的对话结构。数据集采用 MIT 许可证发布。构建过程中已考虑版权和许可合规,不包含原始网站内容。
QUEST SFT Data (Open) is a dataset for supervised fine-tuning (SFT), specifically designed for the tool-using assistant format. It only contains a training set (split: train). The data is organized in the form of dialogue trajectories, with the core column being messages, which consists of a list of dictionaries, each containing role and content fields, typically corresponding to multi-turn human-machine interactions or instruction-following dialogue structures. The dataset is released under the MIT license. During construction, copyright and licensing compliance were considered, and it does not include original website content.
提供机构:
OSU NLP Group
创建时间:
2026-05-21
搜集汇总
数据集介绍

构建方式
Quest-SFT-Data-Open-ended数据集是基于QUEST框架构建的开放式监督微调轨迹数据集。该数据集专为工具使用型助手场景设计,采用标准的对话格式,每条样本包含一个消息列表,其中每条消息均由角色(role)和内容(content)字段构成。数据集仅提供训练集(train split),并支持流式加载,便于高效处理大规模数据。数据构建过程中严格遵循版权与许可规范,不包含任何原始网页内容,确保合规性与安全性。
特点
该数据集的核心特点在于其开放式的监督微调轨迹设计,专注于工具使用场景下的多轮对话交互。每条样本以结构化的消息列表形式呈现,清晰区分用户与模型的角色,便于模型学习工具调用的上下文依赖。数据集采用流式加载方式,有效降低内存占用,适合大规模分布式训练。此外,数据集已去除原始网页内容,仅保留经过处理的交互轨迹,降低了版权风险,提升了数据的使用灵活性。
使用方法
用户可通过HuggingFace的datasets库轻松加载该数据集,示例代码中展示了使用load_dataset函数并指定流式读取的方式,以迭代器形式逐条获取样本。数据集仅包含训练集,用户可直接用于模型的有监督微调(SFT)任务。典型用法是遍历数据集,提取每条样本的messages字段,将其作为训练对话输入,适配基于Transformer架构的工具使用型语言模型。建议在加载时启用流式模式以处理大规模数据。
背景与挑战
背景概述
Quest-SFT-Data-Open-ended数据集由美国俄勒冈州立大学自然语言处理实验室(OSU NLP Lab)研发,于2024年发布,旨在推动大规模语言模型在工具调用场景下的监督微调研究。该数据集聚焦于开放式的工具使用对话轨迹,通过构建结构化的多轮交互样本,解决了传统指令微调数据在复杂任务规划与外部工具协同方面的不足。其核心贡献在于提供了一套标准化的训练格式,使得语言模型能够更有效地学习在对话中动态调用API、数据库等外部资源,从而显著提升模型在自动化任务执行、信息检索和智能助手等领域的实用性与鲁棒性。该数据集的发布为后续工具增强型语言模型的研究奠定了重要基础,并激发了学术界对工具学习范式的广泛探讨。
当前挑战
当前领域面临的核心挑战在于如何让语言模型在真实场景中精确、高效地整合外部工具,包括理解工具功能、规划调用顺序以及处理动态反馈。Quest-SFT-Data-Open-ended在构建过程中同样面临多重困难:首先,需要从海量网络交互中筛选出自然且符合工具使用逻辑的对话样本,避免引入噪声与错误示范;其次,标注人员需在保证任务有效性的同时,确保数据覆盖多样化的工具类型与领域场景,避免模型过拟合于单一模式。此外,版权合规与数据隐私问题也对数据收集构成约束,团队需审慎剔除可能包含敏感信息或侵权内容的样本,以平衡实用性与合法性。这些挑战共同制约着数据集规模的扩展与模型泛化能力的提升。
常用场景
经典使用场景
在工具增强型语言模型的研究前沿,如何让模型精准理解并执行多步工具调用指令,成为提升人机协同效率的关键瓶颈。Quest-SFT-Data-Open-ended数据集专为开放式对话场景下的监督微调设计,其核心用途是训练语言模型遵循工具使用格式的对话轨迹。研究者通常利用该数据集的messages列——包含角色与内容的序列化交互——来引导模型从零开始学习工具调用的逻辑链条,例如在问答任务中模拟调用搜索引擎或计算器API的完整流程,从而赋予模型在未见任务中自主规划工具序列的能力。
衍生相关工作
受Quest-SFT-Data-Open-ended启发,学界涌现了一批标志性衍生工作。斯坦福大学团队基于其数据格式构建了ToolBench扩展集,将工具类别从文本搜索拓展至图像生成与数据库操作。清华大学提出的Tool-Llama框架则以此数据集为种子,采用课程学习策略逐步增加工具链复杂度,最终在API-Bank基准上实现了工具使用成功率37%的提升。此外,Meta的Adaptive Toolformer论文引用了该数据集的轨迹结构设计思想,提出了无需人工标注的合成工具轨迹生成方法,进一步降低了构建训练数据的成本门槛。
数据集最近研究
最新研究方向
Quest-SFT-Data-Open-ended数据集聚焦于开放式工具使用场景下的监督微调轨迹,最新研究方向主要围绕大语言模型在复杂、多步骤任务中的工具调用能力提升。随着AI智能体与工具增强型模型的热潮兴起,该数据集被广泛用于训练模型掌握自主规划与动态工具选择的前沿方法,其开源的标注轨迹为探索半自动化数据合成、少样本泛化及长尾工具组合推理提供了关键基准,推动了从单一问答向工具链协同的范式转变,对构建更可靠的通用助手系统具有战略意义。
以上内容由遇见数据集搜集并总结生成



