Nemotron-SFT-Instruction-Following-Chat-v2

Name: Nemotron-SFT-Instruction-Following-Chat-v2
Creator: NVIDIA
Published: 2026-03-11 23:32:04
License: 暂无描述

Hugging Face2026-03-11 更新2026-03-13 收录

下载链接：

https://huggingface.co/datasets/nvidia/Nemotron-SFT-Instruction-Following-Chat-v2

下载链接

链接失效反馈

官方服务：

资源简介：

Nemotron-Instruction-Following-Chat-v2 数据集旨在广泛增强模型的交互能力，包括开放式聊天和精确指令跟随。该数据集是 [Nemotron-Instruction-Following-Chat-v1](https://huggingface.co/datasets/nvidia/Nemotron-Instruction-Following-Chat-v1) 的更新版本，包含从 [Kimi-K2-Thinking](https://huggingface.co/moonshotai/Kimi-K2-Thinking)、[GLM-4.6](https://huggingface.co/zai-org/GLM-4.6)、[Qwen3-235B-A22B-Thinking-2507](https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507)、[GPT-OSS-120b](https://huggingface.co/openai/gpt-oss-120b)、[Kimi-K2-Instruct-0905](https://huggingface.co/moonshotai/Kimi-K2-Instruct-0905) 和 [Qwen3-235B-A22B-Instruct-2507](https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507) 生成的合成对话。数据集采用混合方法（人工、合成、自动化）进行数据收集和标注，格式为 JSONL，包含文本和元数据。数据集总量为 1,998,568 个样本，磁盘大小约 15GB，适用于商业用途，旨在帮助社区提升模型的指令跟随和聊天能力。

提供机构：

NVIDIA

创建时间：

2026-03-09

搜集汇总

数据集介绍

构建方式

在大型语言模型指令遵循与对话能力训练领域，Nemotron-SFT-Instruction-Following-Chat-v2数据集采用了前沿的混合构建范式。其核心数据源于对多个先进开源模型生成内容的整合与精炼，具体融合了来自Kimi-K2-Thinking、GLM-4.6、Qwen3-235B-A22B-Thinking-2507、GPT-OSS-120b、Kimi-K2-Instruct-0905以及Qwen3-235B-A22B-Instruct-2507等模型的合成对话。这一过程结合了自动化生成与人工筛选，旨在对初版数据集进行全面更新与内容扩充，最终形成了包含近两百万条样本、容量约15GB的庞大多样性语料库，为模型训练提供了坚实的合成数据基础。

特点

该数据集最显著的特征在于其专为增强模型的交互与指令遵循能力而设计，特别强化了开放式聊天与精确指令执行两大核心场景。数据以JSONL格式组织，结构清晰，包含文本内容与相关元数据，便于程序化处理。数据集明确划分为“reasoning_on”与“reasoning_off”两个子集，这一划分可能对应是否包含思维链或推理过程的不同对话模式，为研究者探究模型在不同复杂度任务下的表现提供了结构化对比资源。其遵循ODC-By许可，确保了在商业应用中的可及性与合规性。

使用方法

该数据集主要服务于社区，用于持续提升语言模型的指令遵循与对话能力。使用者可直接加载JSONL文件，将其应用于监督式微调或作为评估基准。实践建议将其与初版Nemotron-Instruction-Following-Chat-v1数据集结合使用，以获取更全面的训练语料。在具体应用中，开发者需根据自身行业与用例需求，对数据质量与适用性进行内部评估，并积极关注潜在的伦理风险与产品误用问题，确保符合可信人工智能的开发准则。

背景与挑战

背景概述

在大型语言模型蓬勃发展的时代背景下，指令遵循与开放式对话能力成为衡量模型交互智能的核心指标。由NVIDIA公司于2025年11月发布的Nemotron-SFT-Instruction-Following-Chat-v2数据集，旨在系统性地增强模型在广泛场景下的交互性能。该数据集作为其前代版本的迭代更新，汇聚了来自多个先进开源模型生成的合成对话数据，其核心研究问题聚焦于如何通过高质量、多样化的指令-响应配对数据，提升模型对复杂意图的理解与执行精度，从而推动对话式人工智能向更自然、更可靠的方向演进，对开源社区及商业应用均具有显著的促进意义。

当前挑战

该数据集致力于应对指令遵循与开放式聊天任务中的核心挑战，即如何使模型在理解用户多样化、多轮次、隐含意图的复杂指令时，生成连贯、准确且符合伦理规范的回应。在构建过程中，挑战主要源于合成数据生成的质量控制与多样性平衡。整合来自多个不同架构与训练目标的源模型（如Kimi-K2-Thinking、Qwen3-235B等）的输出，需解决数据风格统一性、潜在偏见消除以及逻辑一致性校验等问题，以确保最终数据集的纯净度与实用性，为模型训练提供坚实可靠的基础。

常用场景

经典使用场景

在自然语言处理领域，指令遵循与开放式对话能力的提升是模型交互性能的核心挑战。Nemotron-SFT-Instruction-Following-Chat-v2数据集通过集成多源合成对话，为模型训练提供了丰富且高质量的指令-响应对。该数据集最经典的使用场景在于微调大型语言模型，以增强其在开放域聊天和精确指令执行方面的泛化能力，尤其适用于需要模型理解复杂用户意图并生成连贯、相关回复的交互任务。

实际应用

在实际应用层面，该数据集可广泛部署于智能客服、虚拟助手和教育辅导等场景。通过训练模型精准理解用户查询并生成自然、有用的回应，它能提升服务自动化水平与用户体验。例如，在客服系统中，模型可基于该数据学习处理多样化问题，减少人工干预；在教育领域，则可辅助生成个性化学习指导，体现了其在现实世界中增强AI交互实用性的价值。

衍生相关工作

该数据集衍生了多项经典研究工作，尤其是在指令调优和对话模型优化方向。基于其前身Nemotron-Instruction-Following-Chat-v1的升级，它促进了如高效微调策略、多模型知识蒸馏以及合成数据质量评估等方法的探索。相关研究常利用该数据集验证模型在指令遵循基准上的性能，推动了开源社区在构建可商用、高性能对话AI方面的协作与创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集