five

nemotron-terminal-debugging

收藏
Hugging Face2026-04-13 更新2026-04-14 收录
下载链接:
https://huggingface.co/datasets/laion/nemotron-terminal-debugging
下载链接
链接失效反馈
官方服务:
资源简介:
nemotron-terminal-debugging 数据集是 nvidia/Nemotron-Terminal-Corpus 数据集的一个过滤子集,专门针对调试任务(source == 'debugging')。该数据集保留了原始数据集的难度分类(easy / medium / mixed),并为未标记难度的数据(来自 dataset_adapters/* 文件)标记为 'na'。数据集包含原始数据集的列(如 conversations, agent, model, model_provider, date, task, episode, run_id, trial_name, enable_thinking)以及新增的列:source(分区键,此处为 'debugging')、difficulty(难度等级)和 original_source(仅在 adapters_code 中存在,保留原始 source 列的值)。数据集适用于代码、终端、代理、跟踪和 sft 相关的问答任务,语言为英语,采用 CC-BY-4.0 许可。
提供机构:
LAION eV
创建时间:
2026-04-13
原始信息汇总

nemotron-terminal-debugging 数据集概述

数据集来源

数据集内容与结构

  • 任务类别:问答
  • 主要语言:英语
  • 标签:代码、终端、智能体、追踪、监督微调
  • 分区方案
    • adapters_{code,math,swe}:数据来自 dataset_adapters/{code,math,swe}.parquet
    • {skill}(例如 debugging, security, …):数据来自 synthetic_tasks/skill_based/{easy,medium,mixed}/{skill}/data_filtered.parquet
  • 数据文件
    • config_name: default
    • split: train
    • path: data.parquet

数据列说明

  • 继承自源数据集的列conversations, agent, model, model_provider, date, task, episode, run_id, trial_name, enable_thinking
  • 新增列
    • source:分区键,在本数据集中始终为 "debugging"
    • difficulty:难度等级,取值为 easy / medium / mixed / na。其中 na 用于未携带难度标签的 dataset_adapters/* 文件。
    • original_source:仅出现在 adapters_code 分区中,用于保留上游文件中原始的 source 列值(OpenCodeReasoningsynthetic)。

许可信息

  • 许可证:CC-BY-4.0

引用信息

bibtex @misc{pi2026dataengineeringscalingllm, title={On Data Engineering for Scaling LLM Terminal Capabilities}, author={Renjie Pi and Grace Lam and Mohammad Shoeybi and Pooya Jannaty and Bryan Catanzaro and Wei Ping}, year={2026}, eprint={2602.21193}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2602.21193}, }

搜集汇总
数据集介绍
main_image_url
构建方式
在终端智能体研究领域,nemotron-terminal-debugging数据集作为Nemotron-Terminal-Corpus的一个专项子集,其构建过程体现了精细化的数据工程策略。该数据集通过筛选源数据中来源标记为“debugging”的样本,并依据原始难度标签(easy、medium、mixed)进行划分,确保了数据在调试任务上的纯粹性与层次性。其分区方案清晰,既包含了来自特定技能文件夹的过滤数据,也整合了适配器文件中的相关条目,同时保留了完整的元数据轨迹,为研究终端环境下的代码调试行为提供了结构化的基础。
特点
该数据集的核心特点在于其专注于终端环境下的代码调试任务,涵盖了从易到难的不同复杂度场景。数据集中不仅包含了完整的对话历史、代理信息、模型来源及任务元数据,还额外标注了数据来源分区与难度等级,使得研究者能够针对特定技能水平或任务类型进行深入分析。其结构设计保留了原始数据集的丰富上下文与执行轨迹,为训练或评估具备终端交互与问题诊断能力的智能体模型提供了高质量、多粒度的语料支持。
使用方法
使用者可通过加载对应的parquet文件直接访问数据集,其中训练集已整合于data.parquet内。在具体应用中,研究人员可依据‘difficulty’字段对样本进行难度分层,以构建渐进式的训练或评估流程。对话序列(‘conversations’列)完整记录了终端指令与响应的交互过程,可直接用于监督微调或强化学习训练。同时,丰富的元数据如‘agent’、‘model’、‘task’等为分析模型行为、追踪任务执行提供了便利,支持在终端智能体、代码调试与自动化任务等方向开展实证研究。
背景与挑战
背景概述
在人工智能与软件工程交叉领域,终端调试任务对智能体理解与执行代码修复提出了核心要求。Nemotron-Terminal-Debugging数据集由NVIDIA研究团队于2026年构建,作为Nemotron-Terminal-Corpus的专项子集,聚焦于代码调试场景下的对话轨迹数据。该数据集旨在通过结构化的人机交互记录,探索大型语言模型在终端环境中诊断与解决编程错误的能力,为自动化软件维护与智能编程助手的发展提供了关键数据支撑。
当前挑战
该数据集致力于应对终端智能体在代码调试任务中面临的复杂挑战,包括错误定位的模糊性、多步骤修复的逻辑连贯性,以及交互过程中的环境状态跟踪。在构建过程中,研究人员需克服合成数据与真实调试场景间的语义鸿沟,确保对话轨迹既涵盖多样化的错误类型,又保持任务难度分级的合理性,同时处理原始数据来源异构带来的标注一致性问题。
常用场景
经典使用场景
在终端调试领域,nemotron-terminal-debugging数据集为大型语言模型提供了丰富的交互式对话轨迹,这些轨迹模拟了真实环境中的代码调试过程。研究者利用该数据集训练模型理解终端命令序列、错误诊断与修复策略,从而提升模型在自动化调试任务中的表现。通过包含不同难度级别的样本,数据集支持模型从基础到复杂的调试技能学习,为终端智能体的开发奠定了数据基础。
实际应用
在实际软件开发与运维中,nemotron-terminal-debugging数据集能够赋能自动化调试工具的开发,帮助构建智能终端助手以辅助程序员快速定位代码缺陷。这些工具可集成到集成开发环境或持续集成流水线中,通过自然语言交互指导用户修复错误,从而减少人工调试时间并提升软件质量。此外,数据集还支持教育场景,用于培训新手开发者掌握终端调试技能。
衍生相关工作
基于nemotron-terminal-debugging数据集,学术界衍生了一系列经典研究工作,主要集中在终端智能体的架构设计与能力评估方面。例如,研究者利用该数据训练了能够执行复杂调试链的强化学习模型,并开发了多模态终端代理以整合代码与自然语言理解。这些工作进一步拓展了数据集的用途,推动了自动化软件工程、人机协作调试等前沿方向的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作