CodeContests
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/CodeContests
下载链接
链接失效反馈官方服务:
资源简介:
CodeContests 是用于机器学习的竞争性编程数据集。该数据集在训练 AlphaCode 时使用。它由各种来源的编程问题组成。问题包括成对输入和输出形式的测试用例,以及各种语言中正确和不正确的人类解决方案。
CodeContests is a competitive programming dataset for machine learning. This dataset was used during the training of AlphaCode. It comprises programming problems sourced from various origins. Each problem includes test cases in the form of paired input and output, as well as correct and incorrect human-written solutions in various programming languages.
提供机构:
OpenDataLab
创建时间:
2022-08-19
搜集汇总
数据集介绍

背景与挑战
背景概述
CodeContests是一个专为机器学习设计的竞争性编程数据集,最初用于训练DeepMind的AlphaCode模型。该数据集包含多样化的编程问题,每个问题都配有输入输出测试用例以及多种语言的人类解决方案(包括正确和错误示例),适用于文本到代码生成等任务。数据集由DeepMind于2022年发布,采用CC BY 4.0许可证,支持代码生成和预训练研究。
以上内容由遇见数据集搜集并总结生成



