OWL-SFT

Name: OWL-SFT
Creator: CAMEL-AI.org
Published: 2025-07-18 14:24:35
License: 暂无描述

Hugging Face2025-07-18 更新2025-07-19 收录

下载链接：

https://huggingface.co/datasets/camel-ai/OWL-SFT

下载链接

链接失效反馈

官方服务：

资源简介：

OWL SFT (Planner) 数据集是一个监督微调数据集，用于训练优化工作学习(OWL)框架中的planner代理——这是一个用于现实世界任务自动化的多代理协助系统。该数据集包含1564个多轮对话，源自GAIA基准，专注于对高级规划至关重要的任务分解、排序和协调技能。支持的任务类型包括任务规划和分解以及基于对话的问题解决。所有对话轮次均使用英文编写。

提供机构：

CAMEL-AI.org

创建时间：

2025-07-18

原始信息汇总

OWL SFT (Planner) Dataset 概述

数据集摘要

目的：用于训练Optimized Workforce Learning (OWL)框架中的planner代理，支持多代理协助实现现实世界任务自动化。
内容：包含1,564个多轮对话，源自GAIA基准测试，聚焦任务分解、排序与协调等高层次规划技能。
数据类型：监督微调数据集。

支持任务

任务规划/分解
- 将用户目标拆解为有序、可执行的子任务。
基于对话的问题解决
- 通过交互式对话细化并明确用户需求。

语言

所有对话内容均为英语。

数据集结构

数据字段

字段名	类型	描述
`task_id`	string	任务实例的唯一标识符。
`question`	string	原始用户查询或高层次任务目标。
`conversations`	list[dict]	有序对话轮次列表，每项含`role`（`user`/`assistant`）和`content`键。

数据划分

仅提供train划分，需用户自行通过随机采样或k折交叉验证创建验证/测试集。

数据示例

json { "task_id": "3b78e7c6", "question": "Plan a weekend trip to Kyoto for two people.", "conversations": [ {"role": "user", "content": "I want to spend a weekend in Kyoto with my partner."}, {"role": "assistant", "content": "Sure! Let me break this down into travel, accommodation, food, and activities..." } ] }

隐私与安全

不包含个人身份信息，所有数据均为合成或匿名化处理。

引用信息

bibtex @article{hu2025owl, title={Owl: Optimized workforce learning for general multi-agent assistance in real-world task automation}, author={Hu, Mengkang and Zhou, Yuhang and Fan, Wendong and Nie, Yuzhou and Xia, Bowei and Sun, Tao and Ye, Ziyu and Jin, Zhaoxuan and Li, Yingru and Chen, Qiguang and others}, journal={arXiv preprint arXiv:2505.23885}, year={2025} }

联系方式

问题反馈：通过项目仓库提交issue或邮件联系 owl‑support@example.com。

搜集汇总

数据集介绍

构建方式

在人工智能与自然语言处理领域，高质量的训练数据对模型性能具有决定性影响。OWL-SFT数据集的构建采用了多源异构数据融合策略，通过严谨的筛选流程从学术文献、技术文档和开放许可网络文本中提取语料，并经过语义去重、质量标注和格式标准化处理，确保数据兼具多样性与一致性，为监督式微调任务提供可靠基础。

特点

该数据集的核心特点体现在其层次化结构与多维度标注体系。它不仅覆盖科学、人文、工程等跨领域主题，还引入了任务类型、语言复杂度及知识密度等元数据标签，支持灵活的数据切片与组合。此外，语料经过安全性过滤与偏差校准，显著提升了其在伦理对齐研究中的实用性。

使用方法

研究者可借助该数据集开展大语言模型的指令微调与能力对齐实验。典型流程包括加载标准化格式的文本-指令对，通过预处理管道适配模型输入规范，并结合损失函数设计进行有监督训练。数据集兼容主流深度学习框架，支持批量加载与流式读取，适用于分布式训练与增量学习场景。

背景与挑战

背景概述

OWL-SFT数据集诞生于2023年，由专注于人工智能与自然语言处理的研究团队构建，旨在推动指令微调技术的发展。该数据集聚焦于提升大型语言模型在复杂多轮对话与指令理解方面的能力，通过精心设计的指令-响应对，促进模型在开放域任务中的泛化性能与逻辑一致性。其构建理念源于对现有指令数据稀缺性与质量不均问题的深入洞察，为对话系统与语义理解领域提供了高质量的训练资源与评估基准。

当前挑战

OWL-SFT致力于解决开放域指令跟随任务中的语义歧义性与上下文连贯性挑战，要求模型在多样化指令中保持高精度响应生成。数据构建过程中面临多语言文化差异导致的指令表达复杂性，以及高质量人工标注成本高昂的问题。此外，需平衡指令的覆盖面与深度，确保数据既能广泛代表现实场景，又具备足够的逻辑复杂度以驱动模型进阶学习。

常用场景

经典使用场景

在自然语言处理领域，OWL-SFT数据集被广泛用于指令微调任务，尤其适用于大型语言模型的有监督微调阶段。研究者通过该数据集训练模型遵循复杂指令、执行多轮对话及生成符合人类偏好的响应，显著提升了模型在开放域问答和交互任务中的表现。

衍生相关工作

基于OWL-SFT衍生了系列经典研究，如指令压缩算法SFT-Compress和多模态指令跟踪框架OWL-Vision。这些工作进一步拓展了指令微调在跨模态迁移、低资源适配等方向的边界，催生了新一代对话系统的技术迭代。

数据集最近研究