KodCode-V1 编码合成数据集
收藏超神经2025-03-10 更新2025-03-15 收录
下载链接:
https://hyper.ai/cn/datasets/38223
下载链接
链接失效反馈官方服务:
资源简介:
KodCode 由微软 GenAI 、华盛顿大学、德克萨斯大学奥斯汀分校的研究人员于 2025 年发布,相关论文成果为「KodCode : A Diverse, Challenging, and Verifiable Synthetic Dataset for Coding」。
KodCode数据集由微软GenAI、华盛顿大学与德克萨斯大学奥斯汀分校的研究人员于2025年正式发布,其配套学术论文题为《KodCode:面向编程任务的多样化、高挑战性且可验证的合成数据集》(KodCode : A Diverse, Challenging, and Verifiable Synthetic Dataset for Coding)。
创建时间:
2025-03-10
搜集汇总
数据集介绍

背景与挑战
背景概述
KodCode-V1是由微软、华盛顿大学等机构于2025年发布的最大全合成开源编码数据集,包含447K个经过验证的问题-解决方案-测试三元组,涵盖12个子集,专为监督微调和RL调优设计。
以上内容由遇见数据集搜集并总结生成



