five

Nemotron-SFT-OpenCode-v1

收藏
Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/nvidia/Nemotron-SFT-OpenCode-v1
下载链接
链接失效反馈
官方服务:
资源简介:
Nemotron-SFT-OpenCode-v1是一个旨在增强大型语言模型(LLMs)在OpenCode命令行界面(CLI)框架中操作能力的指令调优数据集,同时赋予模型简单的工具调用和代理技能能力。该数据集适用于商业和非商业用途,包含多个子集,如通用问题、仅限bash工具、代理技能等,这些问题和代理技能由GPT OSS 120B模型合成生成,代理解决方案轨迹由Qwen3-Coder-480B-A35B-Instruct生成。数据集采用JSONL格式,总样本量约459K,存储量约30GB。适用于构建自主软件工程代理和代码辅助工具的LLM工程师和研究团队,用于监督微调和模型蒸馏,以改善代码编辑行为、代理策略基准测试和调试。数据集由NVIDIA Corporation创建,采用Creative Commons Attribution 4.0 International License (CC BY 4.0)许可。
提供机构:
NVIDIA
创建时间:
2026-03-13
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作