ml-intern-sessions
收藏Hugging Face2026-05-04 更新2026-05-05 收录
下载链接:
https://huggingface.co/datasets/lewtun/ml-intern-sessions
下载链接
链接失效反馈官方服务:
资源简介:
ML Intern会话轨迹数据集包含从本地ML Intern运行中上传的编码代理会话记录,以JSON Lines格式存储,每个会话对应一个文件。每条记录包含Claude-Code风格的事件流,可能包括用户消息、助手回复、工具调用、工具结果、模型元数据和时间戳等信息。该数据集专为Hugging Face代理轨迹查看器设计,适用于文本生成和编码代理相关研究。但需注意数据集可能包含未完全擦除的敏感信息,如提示词、代码等,使用前需谨慎检查。
The ML Intern session trajectory dataset contains encoded agent session records uploaded from local ML Intern runs. The data is stored in JSON Lines format, with each session corresponding to a file. Each record contains Claude-Code style event streams, which may include user messages, assistant replies, tool calls, tool results, model metadata, and timestamps. This dataset is specifically designed for the Hugging Face agent trajectory viewer and is suitable for text generation and coding agent-related research. Note that the dataset may contain unscrubbed sensitive information such as prompts, code, etc., and requires careful inspection before use.
创建时间:
2026-05-01
原始信息汇总
数据集概述:ML Intern Session Traces
数据集名称
- ML Intern Session Traces(机器学习实习生会话记录)
语言
- 英语
许可协议
- 其他(未明确指定标准开源协议)
任务类别
- 文本生成
标签
- 智能体记录、编码智能体、机器学习实习生、会话记录、Claude Code、Hugging Face Agent 追踪查看器
数据集配置
- 默认配置:包含一个训练集,数据文件为
sessions/**/*.jsonl格式
数据描述
- 数据集包含从本地 ML Intern 运行中上传的编码智能体会话记录。
- 每个
*.jsonl文件对应一个完整的 ML Intern 会话,已被转换为 Claude Code 风格的事件流,适用于 Hugging Face Agent 追踪查看器。 - 记录内容可能包括:用户消息、助手消息、工具调用、工具结果、模型元数据和时间戳。
- 会话文件按日期组织,路径格式为:
sessions/YYYY-MM-DD/<session_id>.jsonl
相关链接
- ML Intern 演示应用:https://smolagents-ml-intern.hf.space
- ML Intern 命令行工具:https://github.com/huggingface/ml-intern
重要警告
- 未进行全面的去隐私化或人工审查。
- ML Intern 在上传前会自动尝试擦除常见敏感信息(如 Hugging Face、Anthropic、OpenAI、GitHub、AWS 令牌),但此过程不保证隐私安全。
- 会话记录可能包含敏感信息,包括:提示词、代码、终端输出、文件路径、仓库名称、私有任务上下文、工具输出或其他本地开发环境数据。
- 建议将每个会话视为潜在敏感信息,在公开数据集前务必手动审查上传的会话内容并确认无隐私风险。
使用限制
- 编码智能体记录可能包含私人或无关内容、失败实验、用户意外粘贴的凭据以及从本地文件或服务复制的输出。
- 在更改数据集的仓库可见性之前,请谨慎评估风险。
搜集汇总
数据集介绍

构建方式
该数据集源自ML Intern编码智能体的本地运行会话,通过自动化流程将每次交互转化为符合Claude-Code事件流格式的JSON Lines文件。每份会话记录均以独立文件形式存储于按日期组织的目录结构中,路径形如sessions/YYYY-MM-DD/<session_id>.jsonl,从而实现了对用户消息、助手响应、工具调用及其结果、模型元数据与时间戳等关键信息的系统性采集与结构化存档。
使用方法
该数据集可通过Hugging Face生态中的Trace Viewer工具进行直观可视化浏览与探索,支持以事件流形式逐条回放智能体与用户的交互历程。研究人员可利用标准JSON解析库从JSONL文件中提取结构化数据,用于训练对话生成模型、分析工具调用模式或评估编码代理行为。需注意,鉴于数据敏感性,建议在受控环境下使用,并在变换仓库可见性之前完成全面的隐私审查。
背景与挑战
背景概述
在大语言模型与智能体技术迅猛发展的当下,自动化编码智能体逐渐成为提升软件开发效率的重要工具。ML Intern session traces数据集由Hugging Face团队于近期创建,旨在收集并公开来自本地运行的ML Intern编码智能体的完整会话追踪记录。这些记录以JSON Lines格式存储,涵盖用户消息、智能体响应、工具调用及其结果、模型元数据与时间戳等关键信息,为研究智能体在真实开发环境中的行为模式、交互逻辑及决策过程提供了宝贵的数据基础。该数据集的出现,填补了公开可用的编码智能体交互日志稀缺的空白,对于推动智能体评估、训练与可解释性研究具有重要影响力。
当前挑战
该数据集面临的核心挑战源自其构建与使用两个层面。首先,从领域问题看,当前编码智能体在复杂且多变的软件开发任务中仍存在规划失误、工具误用及上下文遗忘等缺陷,该数据集虽能揭示这些行为,却难以从根本上解决智能体在真实环境中的泛化能力与可靠性问题。其次,构建过程中,数据隐私与安全性是显著难题——尽管采用了自动化令牌脱敏技术,但未能进行全面的去标识化或人工审查,会话中仍可能包含敏感代码、凭证、路径或终端输出,导致数据发布潜在风险高。此外,失败实验、离题内容及用户误操作等噪声数据的大量存在,也对数据清洗与有效利用构成了严峻挑战。
常用场景
经典使用场景
在智能体与代码生成领域,ml-intern-sessions数据集为研究者提供了一套弥足珍贵的真实会话轨迹资源。这些轨迹记录了一次完整的ML Intern编码智能体交互过程,涵盖用户消息、助手响应、工具调用及结果反馈等多模态事件流,并以与Hugging Face Agent Trace Viewer兼容的结构化格式存储。该数据集最经典的使用场景是作为编码智能体行为分析的基准语料,用于建模智能体在复杂编程任务中的决策路径、工具调用模式及人机协作动态。研究者可基于这些会话片段,系统性地解析智能体在面对多步推理、环境反馈和异常情况时的策略演化,从而推动更鲁棒、更贴合开发实践的智能体系统设计与评估。
解决学术问题
该数据集精准回应了编码智能体研究中长期存在的可复现性与真实性问题。传统研究多依赖人工构建的模拟对话或简化任务,难以捕捉真实开发环境中智能体与用户间动态偶发的交互细节。ml-intern-sessions凭借海量真实会话轨迹,为学术社区提供了从工具使用的频次分布、错误恢复策略到上下文窗口利用率等微观行为分析的原始素材。它使得研究者能够系统性地测量现有智能体在代码生成、调试与重构等任务中的实际性能瓶颈,并探究隐性知识泄露、注意力偏移等深层现象。这些洞察不仅推动了智能体鲁棒性评估方法论的发展,更催生了针对会话轨迹的隐私保护与数据净化技术研究,为构建安全可信的编码智能体奠定了实证基础。
实际应用
在实际工程环境中,ml-intern-sessions数据集为编码智能体的迭代优化提供了不可替代的反馈回路。产品团队可利用这些会话轨迹进行事后的行为复盘与故障诊断,精准定位智能体在特定场景下的预期偏差,例如工具调用逻辑的死循环、指令理解的多义性歧解或环境适配的版本冲突。基于这些真实交互数据,开发者能够更有针对性地微调模型参数、优化提示模板、扩充实例化约束规则,从而提升智能体的任务完成率与用户体验满意度。此外,该数据集还可作为端到端评测数据集,用于在持续集成管道中自动化检验新版本智能体的行为退化或意外改进,实现了从离线研究到在线部署的闭环赋能。
数据集最近研究
最新研究方向
基于ml-intern-sessions数据集,当前前沿研究方向聚焦于代码智能体(coding agent)的行为建模与交互日志分析,尤其是借助Claude-Code风格的会话轨迹来研究机器学习实习生(ML intern)在真实编程任务中的决策过程、工具调用模式与错误恢复策略。随着HuggingFace Agent Trace Viewer等工具的普及,该数据集为理解智能体与人类协作的底层机制提供了原始素材,可支撑会话级性能评估、长上下文推理分析以及安全审计。热点事件包括AI辅助编程的伦理与隐私边界讨论,而该数据集的发布恰为研究工具调用透明度、敏感信息脱敏策略及开放式环境下的智能体稳健性提供了关键数据基础,对推动下一代可解释、可审计的编程助手系统具有里程碑意义。
以上内容由遇见数据集搜集并总结生成



