prometheus04/nemotron-terminal-microagent

Name: prometheus04/nemotron-terminal-microagent
Creator: prometheus04
Published: 2026-05-02 11:40:09
License: 暂无描述

Hugging Face2026-05-02 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/prometheus04/nemotron-terminal-microagent

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: - config_name: default features: - name: conversations list: - name: content dtype: string - name: role dtype: string - name: original_task dtype: string - name: source dtype: string - name: num_turns dtype: int64 - name: token_count dtype: int64 - name: truncation_applied dtype: string - name: thinking_turns list: int64 splits: - name: train num_bytes: 799750865 num_examples: 34867 download_size: 321561441 dataset_size: 799750865 - config_name: processed_single_command features: - name: conversations list: - name: content dtype: string - name: role dtype: string - name: original_task dtype: string - name: source dtype: string - name: num_turns dtype: int64 - name: token_count dtype: int64 - name: truncation_applied dtype: string - name: thinking_turns list: int64 - name: preprocessed dtype: string splits: - name: train num_bytes: 675846813 num_examples: 34867 download_size: 281290285 dataset_size: 675846813 configs: - config_name: default data_files: - split: train path: data/train-* - config_name: processed_single_command data_files: - split: train path: processed_single_command/train-* ---

提供机构：

prometheus04

搜集汇总

数据集介绍

构建方式

nemotron-terminal-microagent数据集的构建聚焦于终端控制与微代理场景，旨在模拟复杂指令交付与智能体交互过程。原始数据通过对多样化终端任务进行收集与整理，形成包含多层次对话结构的样本集。每条数据均以conversations字段记录角色与内容的交替序列，并辅以original_task标识原始任务、source标记来源、num_turns与token_count量化对话复杂度。此外，truncation_applied与thinking_turns字段分别标注截断状态及思考轮次，以精细刻画推理路径。数据分为default与processed_single_command两个配置：前者保留原始形态，后者对单命令场景进行预处理，新增preprocessed字段以便下游任务直接使用。

特点

该数据集的核心特点体现在其对微代理情境下多轮推理与指令执行的深度建模。每个样本包含完整的对话链条，role字段明确划分用户与助手交互角色，content承载自然语言指令与响应。thinking_turns字段独树一帜，记录模型在进行功能调用前所需的中间思考环节，为研究链式推理提供天然标注。数据集规模达34,867条训练样本，token数量与轮次分布高度变异，覆盖从简单单轮到复杂多回合指令序列，助力训练模型适应真实终端环境的动态需求。processed_single_command配置进一步精简，聚焦单一命令型交互，降低噪声并提升样本实用性。

使用方法

使用nemotron-terminal-microagent数据集时，研究者可通过HuggingFace Datasets库直接加载。默认配置下，调用load_dataset('nemotron-terminal-microagent', 'default')获取原始数据，其中conversations字段可直接用于对话模型训练或微调。对于聚焦单命令场景的任务，选择processed_single_command配置，其preprocessed字段提供了经过规范化的输入输出对，便于直接应用于监督学习。数据中original_task与source字段支持按任务类型或来源进行过滤，num_turns与token_count可用于采样策略控制。推荐将thinking_turns用于强化学习中的奖励塑造或中间监督信号，以增强模型在终端操作中的规划能力。

背景与挑战

背景概述

在多智能体协作与复杂终端操作任务日益增长的背景下，如何让语言模型高效理解并执行终端指令成为关键研究课题。nemotron-terminal-microagent数据集由NVIDIA研究团队于2024年创建，旨在为终端代理（terminal agent）提供细粒度的微调训练数据。该数据集包含约3.5万条对话记录，每条对话详细记录了模型与用户的多轮交互，涵盖原始任务描述、对话轮次、思考步骤等关键信息。通过模拟终端环境中的真实交互场景，该数据集着力提升语言模型在命令行操作、系统配置等专业领域的指令跟随能力，为终端自动化与智能运维领域提供重要的数据基础，推动了大语言模型在专业工具使用方面的研究进展。

当前挑战

该数据集面临的核心挑战体现在两个方面：首先，终端操作具有高度专业化与结构化的特征，语言模型需要准确理解命令语义、参数含义及执行上下文，而传统自然语言训练数据难以覆盖终端类任务特有的符号化表达与错误处理逻辑。其次，在数据构建过程中，如何从真实终端会话中提取高质量、多轮次的交互样本，并确保每个指令的思考链条与执行步骤完整且逻辑一致，是一大难题。此外，模型在推理时需要对输出进行截断处理，以保证终端命令的精确性，这对数据清洗与格式标准化提出了极高要求，同时需避免因指令过长或上下文丢失导致的执行失败。

常用场景

经典使用场景

在智能体与交互式任务日益复杂的背景下，Nemotron-Terminal-MicroAgent数据集以多轮对话结构为核心，专为训练和评估具备记忆与推理能力的轻量级智能代理模型而设计。该数据集包含近3.5万条训练样本，每条样本都包含完整的对话轮次、思考过程标记以及任务来源信息，使其成为研究终端命令执行、上下文感知对话和单一指令多步推理等场景的理想选择。研究者常利用该数据集微调小型语言模型，使其在资源受限的环境中依然能完成复杂的终端操作任务，例如模拟Linux命令行的自动补全与错误修正。

衍生相关工作

该数据集的出现带动了多个方向的研究工作，包括基于逆强化学习的终端任务生成器、结合环境反馈的交互式微调框架，以及面向领域特定语言（DSL）的指令优化算法。例如，有研究在其基础上构建了“思考-行动-观察”循环的强化学习环境，使智能体能够从错误尝试中自我修正。另一经典工作是将其与分层解码架构结合，显著提升了多轮命令链的生成准确性。此外，该数据集还被用作评测基准，验证了对比学习与数据增强技术在终端指令遵循任务中的有效性，为后续Agent的泛化能力研究奠定了坚实基础。

数据集最近研究