Nemotron-SFT-OpenCode-v1
收藏Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/nvidia/Nemotron-SFT-OpenCode-v1
下载链接
链接失效反馈官方服务:
资源简介:
Nemotron-SFT-OpenCode-v1是一个旨在增强大型语言模型(LLMs)在OpenCode命令行界面(CLI)框架中操作能力的指令调优数据集,同时赋予模型简单的工具调用和代理技能能力。该数据集适用于商业和非商业用途,包含多个子集,如通用问题、仅限bash工具、代理技能等,这些问题和代理技能由GPT OSS 120B模型合成生成,代理解决方案轨迹由Qwen3-Coder-480B-A35B-Instruct生成。数据集采用JSONL格式,总样本量约459K,存储量约30GB。适用于构建自主软件工程代理和代码辅助工具的LLM工程师和研究团队,用于监督微调和模型蒸馏,以改善代码编辑行为、代理策略基准测试和调试。数据集由NVIDIA Corporation创建,采用Creative Commons Attribution 4.0 International License (CC BY 4.0)许可。
提供机构:
NVIDIA
创建时间:
2026-03-13



