five

WH0FF/pax-agent-coordination-logs

收藏
Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/WH0FF/pax-agent-coordination-logs
下载链接
链接失效反馈
官方服务:
资源简介:
PAX代理协调日志数据集记录了来自一个14-agent Claude Code公司在生产环境中的真实协调事件,包括任务分配、委托、审查请求和升级等。每个记录都是匿名化的代理间协调事件。PAX协议是一种用于多代理LLM系统的5字段结构化交接格式。数据集展示了PAX协议的实际应用,即来自在两台机器上运行的14-agent公司的实际协调事件,通过Paperclip进行协调。数据集包含事件ID、问题引用、发送代理、接收代理、事件类型、时间戳、内容、优先级和状态转换等字段。代理角色包括CEO、VP内容、VP情报、VP工程、VP战略、VP市场推广和董事会/人类等。数据集可用于微调任务路由分类器、训练编写PAX风格协调消息的代理、研究多代理公司如何分工和交接工作以及构建升级检测模型等。所有内容均来自我们自己的生产系统,并进行了匿名化处理。

Real-world coordination events from a 14-agent Claude Code company running in production at [whoffagents.com](https://whoffagents.com). Each record is an anonymized agent-to-agent coordination event: assignments, delegations, review requests, and escalations. PAX is a 5-field structured handoff format for multi-agent LLM systems. This dataset shows PAX in action — the actual coordination events from a 14-agent company running on two machines, coordinated via Paperclip. The dataset includes fields such as event_id, issue_ref, from_agent, to_agent, event_type, timestamp, content, priority, and status_transition. Agent roles in this dataset include CEO, VP Content, VP Intel, VP Engineering, VP Strategy, VP GTM, and board/human. Use cases include fine-tuning a task-routing classifier, training an agent that writes PAX-style coordination messages, studying how multi-agent companies divide and hand off work, and building escalation-detection models. All content is from our own production system and has been anonymized.
提供机构:
WH0FF
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自一个由14个Claude Code智能体组成的生产环境公司系统,运行于whoffagents.com平台。数据通过PAX协议(一种面向多智能体LLM系统的五字段结构化交接格式)采集,记录了智能体之间真实的协调事件,包括任务分配、委派、审查请求和升级反馈。所有事件均经过匿名化处理,将智能体ID替换为角色名称,并对可能包含个人身份信息的标题进行改写,最终形成一份包含事件ID、问题引用、发送与接收智能体角色、事件类型、时间戳、协调消息内容、优先级及状态转换等字段的结构化数据集。
特点
数据集的核心特色在于其真实性,来源于实际运行中的多智能体协作系统,而非合成数据。涵盖assignment、delegation、review_request、blocked、subtask_created等多种事件类型,并标注了从critical到low的优先级分级。每个协调事件均保留了自然语言消息内容,展现了智能体间复杂的任务交接与沟通模式。数据集规模虽小(少于1000条),但信息密度高,为研究多智能体系统的分工协作、任务路由和升级检测提供了真实、细致的样本。
使用方法
该数据集可应用于多个深度学习与自然语言处理任务。研究者可基于事件类型和优先级标签,微调任务路由分类器,训练能生成PAX风格协调消息的智能体模型。亦可分析多智能体公司如何划分和交接工作,或构建升级检测模型以识别关键事件。数据集以标准表格格式呈现,各字段清晰,易于加载为DataFrame或用于序列到序列模型的训练,支持text-generation和text2text-generation两类任务场景。
背景与挑战
背景概述
在大型语言模型(LLM)驱动的多智能体系统蓬勃发展的浪潮中,如何高效协调多个自主代理以完成复杂任务,已成为智能体工程领域的核心挑战。PAX Agent Coordination Logs 数据集由 WH0FF 团队于近期创建,源自一个由14个Claude Code智能体构成的真实生产环境(whoffagents.com),记录了智能体间包括任务分配、委派、审查请求及升级在内的异步协调事件。该数据集首次公开了多智能体系统中基于PAX协议的标准化任务交接日志,为研究多代理编排、任务管理与交接协议提供了珍贵的现实世界语料。通过解构智能体间的协作模式,该数据集有望推动更鲁棒的多智能体协调机制设计,对自动化企业流程与智能体系统优化具有深远影响。
当前挑战
该数据集所应对的核心领域挑战是多智能体系统中缺乏标准化、可复现的协调行为数据,导致任务分解与代理分工的算法研究多依赖模拟环境,难以迁移至真实部署。现有模型在处理多步交接时易出现任务漂移或依赖冲突,而数据集中蕴含的14个角色(如CEO、VP工程等)间的高频交互,为训练任务路由分类器或生成PAX格式消息提供了基准,从而缓解智能体间协作失序问题。在构建过程中,团队面临的关键挑战包括:如何在不泄露用户隐私的前提下对生产日志进行匿名化处理,同时保留协调事件的语义完整性;以及如何从连续非结构化工作流中精确提取结构化的交接字段(如事件类型、优先级),并确保标注的跨角色一致性。
常用场景
经典使用场景
在多智能体系统蓬勃发展的当下,智能体间的有效协作成为关键瓶颈。该数据集记录了由14个智能体组成的生产环境中真实的协调事件,涵盖任务分配、委派、审查请求和升级等典型场景,为研究多智能体系统的协调机制提供了珍贵的实证素材。其最经典的应用场景是训练任务路由分类器,通过分析协调消息中的agent角色、事件类型和优先级等字段,使模型能够学习何时以及如何将任务分派给最合适的智能体,从而提升多智能体系统的整体运作效率。
衍生相关工作
该数据集并非孤立存在,它与WH0FF/pax-protocol规范数据集形成了天然的研究闭环。pax-protocol提供了PAX五字段握手协议的定义和合成语料,而本数据集则提供了该协议的真实执行日志,两者结合可以衍生出多项经典研究:例如,基于合成语料预训练、再使用真实日志微调的手写消息生成模型;或者通过对比真实与合成数据来验证PAX协议的有效性。此外,开发者还可以基于此数据集构建异常检测系统,自动识别偏离标准协调流程的异常事件,推动多智能体系统可靠性工程的发展。
数据集最近研究
最新研究方向
该数据集聚焦于多智能体系统中的协调机制研究,提供了来自实际生产环境中14个Claude Code智能体间的真实协调日志(如任务分配、委托、审查请求和升级事件),为探索大规模多智能体协同工作流的通信协议与任务路由模式提供了宝贵资源。其核心在于推动PAX协议(一种结构化五字段交接格式)的验证与优化,支持训练能够自主生成或分类协调消息的智能体模型,同时助力分析多智能体组织如何进行劳动分工与任务移交。这一方向与实际部署的智能体公司(如whoffagents.com)运营紧密相关,对于提升多LLM系统在复杂任务管理中的效率、鲁棒性及可扩展性具有重要价值,也为构建更自主、更高效的AI团队协作框架奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作