five

nemotron-terminal-adapters_swe

收藏
Hugging Face2026-04-13 更新2026-04-14 收录
下载链接:
https://huggingface.co/datasets/laion/nemotron-terminal-adapters_swe
下载链接
链接失效反馈
官方服务:
资源简介:
nemotron-terminal-adapters_swe 数据集是 nvidia/Nemotron-Terminal-Corpus 的一个子集,专门过滤了来源为 'adapters_swe' 的数据。该数据集保留了原始的难度分类(easy/medium/mixed/na),并添加了分区键 'source' 和难度标签 'difficulty'。数据列包括对话、代理、模型、模型提供商、日期、任务、集数、运行ID、试验名称、启用思考等,以及特定的分区信息。数据集适用于代码、终端、代理等相关的问题回答任务,语言为英语,遵循 CC-BY-4.0 许可。
提供机构:
LAION eV
创建时间:
2026-04-13
原始信息汇总

nemotron-terminal-adapters_swe 数据集概述

数据集来源

数据内容与划分

  • 数据分区:属于 adapters_{code,math,swe} 分区之一,具体对应 dataset_adapters/swe.parquet 文件中的行。
  • 难度标签difficulty 列保留了原始的 easy / medium / mixed 划分。对于来自 dataset_adapters/* 文件的数据(未携带难度标签),其难度值为 na

数据列说明

  • 继承自源数据集的列conversations, agent, model, model_provider, date, task, episode, run_id, trial_name, enable_thinking
  • 新增列
    • source:分区键,在本数据集中始终为 "adapters_swe"
    • difficulty:难度标签,取值为 easy / medium / mixed / na
    • original_source:仅在 adapters_code 分区中存在,用于保留上游文件中的原始 source 列值(OpenCodeReasoningsynthetic)。

任务与语言

  • 任务类别:问答。
  • 语言:英语。
  • 标签:代码、终端、智能体、追踪、监督微调。

许可信息

  • 许可证:CC-BY-4.0。

引用信息

如需引用,请使用以下BibTeX条目: bibtex @misc{pi2026dataengineeringscalingllm, title={On Data Engineering for Scaling LLM Terminal Capabilities}, author={Renjie Pi and Grace Lam and Mohammad Shoeybi and Pooya Jannaty and Bryan Catanzaro and Wei Ping}, year={2026}, eprint={2602.21193}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2602.21193}, }

搜集汇总
数据集介绍
main_image_url
构建方式
在终端智能体研究领域,nemotron-terminal-adapters_swe数据集作为Nemotron-Terminal-Corpus的一个子集,其构建过程体现了精细化的数据工程策略。该子集通过筛选源数据中标记为“adapters_swe”的条目而形成,完整保留了原始数据中的对话序列、代理信息及任务元数据。构建时特别引入了“difficulty”列,用以区分任务的难易程度,包括“easy”、“medium”、“mixed”以及未标记的“na”类别,从而为模型训练提供了结构化的难度梯度。这种基于明确源标识和难度分层的构建方式,确保了数据子集在终端操作任务上的代表性与可分析性。
特点
该数据集的核心特点在于其专注于软件工程领域的终端适配任务,涵盖了代码操作、系统交互等具体场景。数据条目不仅包含多轮对话记录,还整合了代理类型、模型来源及任务执行轨迹等丰富的元信息,为研究终端智能体的行为模式与决策过程提供了多维度的观察窗口。其独特的难度分级标签使得研究者能够针对不同复杂度的任务进行分层训练与评估,而统一的“source”标识则保证了数据来源的清晰可追溯,增强了实验的可复现性。
使用方法
对于旨在提升大型语言模型终端操作能力的研究者而言,该数据集可直接用于监督式微调或行为克隆训练。使用者可以依据“difficulty”列对数据进行分层采样,以构建渐进式的训练课程或进行鲁棒性测试。数据中的“conversations”字段提供了标准的指令-响应对,便于接入常见的训练框架。在评估阶段,该数据集可用于衡量模型在软件工程相关终端命令生成、问题诊断等任务上的性能,其结构化的元数据支持对模型在不同任务类型、代理设置下的表现进行细粒度分析。
背景与挑战
背景概述
随着大型语言模型在代码生成与终端交互任务中的广泛应用,构建高质量、多样化的指令微调数据集成为提升模型泛化能力的关键。Nemotron-Terminal-Adapters_SWE数据集由NVIDIA研究团队于2026年发布,作为Nemotron-Terminal-Corpus的子集,专注于软件工程领域的终端适配任务。该数据集旨在通过真实场景下的对话轨迹与代码执行记录,训练模型理解复杂终端指令并生成准确响应,从而推动智能体在软件开发自动化方面的应用。其构建基于多源数据整合,包括适配器生成的代码任务与技能导向的合成数据,为终端智能体的能力评估提供了标准化基准。
当前挑战
在软件工程终端任务中,模型需处理动态环境下的多步指令、代码片段解析与错误调试等复杂场景,这对模型的推理一致性与上下文理解提出了较高要求。数据构建过程中,挑战主要源于终端交互轨迹的真实性与多样性保障:原始数据需从异构来源(如开源代码库与合成任务)进行清洗与对齐,同时保留难度分级与任务元数据以支持差异化评估。此外,终端指令的模糊性、环境状态的不确定性以及长序列依赖关系的建模,均增加了高质量数据标注与模型泛化能力验证的难度。
常用场景
经典使用场景
在软件工程与代码生成领域,nemotron-terminal-adapters_swe数据集为终端智能体提供了丰富的交互轨迹数据。该数据集通过记录终端命令序列与自然语言对话,能够模拟开发者在解决实际编程问题时的完整思考与操作流程。研究者可借此训练模型理解复杂代码任务,并生成准确的终端指令,从而提升智能体在自动化编程辅助场景下的表现。
衍生相关工作
围绕该数据集衍生的研究多集中于终端智能体的架构优化与能力扩展。经典工作包括基于对话轨迹的指令预测模型、结合强化学习的终端任务规划框架,以及跨领域终端技能迁移方法。这些研究不仅深化了对智能体决策过程的理解,也为构建更通用、鲁棒的自动化编程系统奠定了数据与算法基础。
数据集最近研究
最新研究方向
在软件工程与代码智能领域,nemotron-terminal-adapters_swe数据集作为终端代理任务的关键资源,正推动着大型语言模型在自动化代码调试与安全分析方面的前沿探索。该数据集聚焦于适配器驱动的软件工程任务,通过结构化对话轨迹与难度分级,为模型训练提供了丰富的上下文交互数据。当前研究热点集中于利用此类数据提升智能代理在复杂终端环境中的推理与执行能力,特别是在多轮对话中实现精准的代码修复与漏洞检测。这一方向不仅加速了自动化软件开发工具的演进,也为构建更可靠、可解释的AI辅助编程系统奠定了数据基础,对推动软件工程智能化转型具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作