five

jobseek-agent-traces

收藏
Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/viktoroo/jobseek-agent-traces
下载链接
链接失效反馈
官方服务:
资源简介:
Jobseek Agent Traces数据集包含来自jobseek(一个公司招聘页面监控工具)的Claude Code代理会话追踪记录。每条追踪记录捕获完整的代理工作流程会话,包括公司发现、看板配置、监控器/爬虫选择和质量验证。数据以原始会话转录文本形式存储(非表格数据),采用JSONL格式组织,每个文件包含一个头部行和按时间排序的转录记录(合并了主代理和子代理的记录)。记录类型分为assistant、user和system三种。数据集规模在1K到10K之间,专门用于代理追踪分析,明确标注不可用于AI训练。
创建时间:
2026-03-24
原始信息汇总

Jobseek Agent Traces 数据集概述

基本信息

  • 数据集名称:Jobseek Agent Traces
  • 许可证:mit
  • 数据规模:1K<n<10K
  • 标签:agent-traces, claude-code, not-for-AI-training

数据集描述

该数据集包含来自 jobseek 的 Claude Code 智能体会话轨迹。jobseek 是一个用于监控公司招聘页面的职位发布监测工具。每条轨迹记录了一个完整的智能体工作流会话,包括公司发现、看板配置、监测器/爬虫选择和质量验证。这些是原始的会话转录文本,而非表格数据。

数据结构

数据以目录和文件形式组织:

traces/ {company-slug}/ {date}.jsonl # 每个会话一条轨迹(包含头部信息和记录)

每个 .jsonl 文件以一行头部信息开始: json {"_trace_header": true, "slug": "airbnb", "company_name": "Airbnb", "board_slugs": [...], "date": "2026-03-23", "issue": 594, "record_count": 388}

头部信息之后是按时间顺序排序的会话转录记录(主智能体和子智能体记录已合并)。记录类型包括:assistantusersystem

使用说明

建议使用 trace viewer 工具来探索这些轨迹数据。

相关链接

  • Web 应用:https://jseek.co
  • 源代码:https://github.com/colophon-group/jobseek
  • 轨迹查看器:https://github.com/colophon-group/jobseek/tree/main/apps/trace-viewer
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作