AFTraj-2K
收藏AgentForesight 数据集详情
数据集概述
AgentForesight 是一个面向多智能体系统在线审计的数据集与框架。它将多智能体故障分析从传统的“事后诊断”转变为“在线审计”,即在轨迹展开过程中逐步进行审计,支持在故障传播锁定之前打开运行时干预窗口。
AFTraj-2K 数据集
数据集构成
AFTraj-2K 是一个精心策划的多智能体轨迹语料库,包含 2,276 条轨迹,覆盖三大领域:
| 领域 | 安全轨迹 | 不安全轨迹 | 总计 |
|---|---|---|---|
| Math (数学) | 396 | 397 | 793 |
| Coding (编程) | 361 | 247 | 608 |
| Agentic (智能体) | 405 | 470 | 875 |
| 总计 | 1,162 | 1,114 | 2,276 |
数据集特点
- 安全轨迹经过严格过滤,不安全轨迹由多裁判验证,并在其“决定性错误”步骤进行标注
- 覆盖编码、数学和智能体三类领域任务
- 数据集以 Parquet 格式存储,包含安全轨迹(
aftraj_safe.parquet)和不安全轨迹(aftraj_unsafe.parquet)两个文件
数据访问
- 平台: HuggingFace 🤗
- 仓库地址: ZBox008003/AFTraj
- 许可证: CC BY 4.0
数据字段示例
不安全轨迹包含以下关键字段:conv_id(对话ID)、domain(领域)、mistake_step(错误步骤)、mistake_agent(错误智能体)
在线审计方法
核心创新
- 在线审计协议:在执行时逐帧审计正在展开的轨迹,而非在故障发生后进行诊断
- 精致到粗的强化学习训练:训练一个紧凑的在线审计器
AgentForesight-7B,首先在故障边界建立风险预期先验,然后通过结构、时机和属性优化将其细化为精确的步骤级定位
实验结果
- AgentForesight-7B 在 AFTraj-2K 上达到 66.44 总体 Exact-F1,比最强商业基线 DeepSeek-V4-Pro 高出 +19.88 分
- 绝对步位移(ASS)降低 3 倍
- 在数学(77.36 vs 50.34)和编程(78.87 vs 49.32)领域取得最大提升
代码与使用
代码仓库结构
AgentForesight/ ├── inference/ │ ├── prompts.py # 审计器系统提示 + 聊天模板构建 + 解析器 │ ├── data.py # Parquet 数据加载器 │ ├── metrics.py # Exact-F1 / ASS / FAR / Step-Acc 评估指标 │ ├── infer_local.py # 本地模型审计器推理 │ └── infer_api.py # OpenAI 兼容 API 审计器推理 └── requirements.txt
数据加载示例
python from huggingface_hub import snapshot_download import pandas as pd
local_dir = snapshot_download(repo_id="ZBox008003/AFTraj", repo_type="dataset") safe = pd.read_parquet(f"{local_dir}/aftraj_safe.parquet") unsafe = pd.read_parquet(f"{local_dir}/aftraj_unsafe.parquet")
推理运行
- 本地模型推理:
python -m inference.infer_local --model-path <模型路径> --data-dir <数据路径> --output-dir ./outputs - API 推理:
python -m inference.infer_api --model gpt-4.1 --data-dir <数据路径> --output-dir ./outputs
相关链接
- 论文: arXiv 2605.08715
- 项目页面: https://zbox1005.github.io/agent-foresight/
- 模型检查点: 将在论文接收后于 HuggingFace 发布
- 代码许可证: MIT License




