Nemotron-RL-agent-workplace_assistant

Name: Nemotron-RL-agent-workplace_assistant
Creator: NVIDIA
Published: 2025-11-15 07:20:25
License: 暂无描述

Hugging Face2025-11-15 更新2025-11-16 收录

下载链接：

https://huggingface.co/datasets/nvidia/Nemotron-RL-agent-workplace_assistant

下载链接

链接失效反馈

官方服务：

资源简介：

Nemotron-RL-agent-workplace_assistant是一个多步骤代理环境，用于测试代理在工作场所环境中执行任务的能力。它包含五个数据库、26个工具和690个代表常见商业活动的任务，如发送电子邮件、安排会议等。该数据集是NVIDIA NeMo Gym框架的一部分，用于训练大型语言模型。

提供机构：

NVIDIA

创建时间：

2025-11-14

原始信息汇总

Nemotron-RL-agent-workplace_assistant 数据集概述

数据集描述

名称：Nemotron-RL-agent-workplace_assistant
性质：工具使用多步骤智能体环境
功能：测试智能体在工作场所环境中执行任务的能力
环境构成：包含沙盒环境、5个数据库、26个工具和690个任务
任务类型：代表常见商业活动，如发送电子邮件、安排会议等

数据集基本信息

所有者：NVIDIA Corporation
创建日期：2025年9月27日
许可证：CC BY 4.0
商业使用：已准备好用于商业用途

技术特性

数据收集方法：合成
标注方法：合成
数据格式：纯文本
兼容框架：NeMo-Gym

数据量化

记录数量：1260个查询-答案元组
特征数量：4
总存储量：28.43 MB

使用目的

预期用途：与NeMo-Gym配合使用，用于大语言模型的后训练
所属系列：Nemo Gym Collection
所属框架：NVIDIA NeMo框架中的开源库

参考资源

主要参考：NeMo-Gym (https://github.com/NVIDIA-NeMo/Gym)

搜集汇总

数据集介绍

构建方式

在强化学习研究领域，Nemotron-RL-agent-workplace_assistant数据集通过合成方法构建，其核心架构包含一个模拟真实办公场景的沙盒环境。该环境整合了五个独立数据库与二十六种功能工具，并基于六百九十项典型职场任务生成了一千二百六十组查询-答案元组。数据生成过程严格遵循可验证奖励机制的设计原则，确保每项任务都能对应明确的执行路径与评估标准。

特点

该数据集最显著的特征在于其高度结构化的多步任务设计，涵盖邮件处理、会议安排等常见商务场景。所有任务均通过文本形式呈现，与NeMo-Gym框架实现深度兼容。数据集采用CC BY 4.0开放许可，存储容量为28.43MB，其四维特征设计既保证了任务执行的连贯性，又为智能体决策过程提供了可量化的评估维度。

使用方法

作为NeMo框架的组成部分，该数据集需通过NeMo-Gym环境进行加载与调用。研究人员可通过配置沙盒环境中的工具接口，构建基于强化学习的语言模型训练流程。使用时应严格遵循框架规定的数据格式，将任务指令输入至智能体决策系统，并通过可验证奖励机制持续优化模型在多步任务中的表现。

背景与挑战

背景概述

随着企业数字化转型进程加速，智能办公助手已成为提升组织效能的关键技术。Nemotron-RL-agent-workplace_assistant数据集由NVIDIA公司于2025年9月发布，作为NeMo Gym强化学习框架的核心组件，专门针对职场环境中的多步骤任务执行问题设计。该数据集通过构建包含五个数据库、26种工具和690项任务的沙箱环境，模拟电子邮件处理、会议安排等典型办公场景，为大规模语言模型的强化学习训练提供标准化测试平台。其合成数据生成方法论体现了人工智能在复杂决策任务中的前沿探索，对推动具身智能在商业场景的落地应用具有重要价值。

当前挑战

职场任务自动化面临多重技术挑战：传统序列决策模型难以处理工具调用的组合复杂性，且办公场景中的语义歧义易导致任务执行偏差。数据集构建过程中需克服合成数据与真实业务逻辑的语义对齐问题，既要保证26种工具API的交互真实性，又要维持690项任务在五类数据库中的状态一致性。此外，多步任务链的奖励函数设计需平衡局部操作与全局目标的关系，这对强化学习智能体的长期规划能力提出了更高要求。

常用场景

经典使用场景

在智能办公自动化领域，Nemotron-RL-agent-workplace_assistant数据集通过模拟真实工作环境中的多步骤任务执行，为强化学习代理的训练提供了标准化测试平台。其包含的690项任务覆盖了电子邮件处理、会议安排等典型办公场景，使模型能够在沙盒环境中反复演练复杂决策流程，从而优化任务完成效率与准确性。

衍生相关工作

该数据集催生了系列基于NeMo框架的强化学习研究，包括分层策略网络在工具调用中的优化、多模态指令理解与执行等创新方向。相关成果通过NVIDIA开源生态持续扩展，衍生出适用于医疗咨询、金融服务等垂直领域的专业化任务环境构建方法。

数据集最近研究