five

Project CodeNet

收藏
arXiv2025-09-30 收录
下载链接:
https://developer.ibm.com/technologies/artificial-intelligence/data/project-codenet/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了来自AIZU和AtCoder两个公开评测平台的超过1400万份代码样本,为代码分类任务提供了四个大型且具有挑战性的数据集。这些数据集包括Java250、Python800、C++1000以及C++1400。整个数据集规模超过1400万样本,所涉及的任务是代码分类。

This dataset contains over 14 million code samples sourced from two public programming contest platforms, AIZU and AtCoder, and provides four large-scale and challenging datasets for code classification tasks. The four datasets are Java250, Python800, C++1000, and C++1400. The entire dataset encompasses more than 14 million code samples, with the core task being code classification.
提供机构:
AIZU and AtCoder
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作