jobseek-agent-traces
收藏Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/viktoroo/jobseek-agent-traces
下载链接
链接失效反馈官方服务:
资源简介:
Jobseek Agent Traces数据集包含来自jobseek(一个公司招聘页面监控工具)的Claude Code代理会话追踪记录。每条追踪记录捕获完整的代理工作流程会话,包括公司发现、看板配置、监控器/爬虫选择和质量验证。数据以原始会话转录文本形式存储(非表格数据),采用JSONL格式组织,每个文件包含一个头部行和按时间排序的转录记录(合并了主代理和子代理的记录)。记录类型分为assistant、user和system三种。数据集规模在1K到10K之间,专门用于代理追踪分析,明确标注不可用于AI训练。
创建时间:
2026-03-24
原始信息汇总
Jobseek Agent Traces 数据集概述
基本信息
- 数据集名称:Jobseek Agent Traces
- 许可证:mit
- 数据规模:1K<n<10K
- 标签:agent-traces, claude-code, not-for-AI-training
数据集描述
该数据集包含来自 jobseek 的 Claude Code 智能体会话轨迹。jobseek 是一个用于监控公司招聘页面的职位发布监测工具。每条轨迹记录了一个完整的智能体工作流会话,包括公司发现、看板配置、监测器/爬虫选择和质量验证。这些是原始的会话转录文本,而非表格数据。
数据结构
数据以目录和文件形式组织:
traces/ {company-slug}/ {date}.jsonl # 每个会话一条轨迹(包含头部信息和记录)
每个 .jsonl 文件以一行头部信息开始:
json
{"_trace_header": true, "slug": "airbnb", "company_name": "Airbnb", "board_slugs": [...], "date": "2026-03-23", "issue": 594, "record_count": 388}
头部信息之后是按时间顺序排序的会话转录记录(主智能体和子智能体记录已合并)。记录类型包括:assistant、user、system。
使用说明
建议使用 trace viewer 工具来探索这些轨迹数据。
相关链接
- Web 应用:https://jseek.co
- 源代码:https://github.com/colophon-group/jobseek
- 轨迹查看器:https://github.com/colophon-group/jobseek/tree/main/apps/trace-viewer



