five

CodeGen_Based_构建系统代码生成实证研究数据集

收藏
海数据2026-06-02 收录
下载链接:
https://haidatas.com/dataset/codegen_based_goujianxitongdaimashengcheng_28eff818
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集为构建系统代码生成实证研究的复制包,包含用于训练和测试CodeGen大语言模型的构建文件数据。数据分为来自Apache软件基金会的专家数据集(9,426个构建文件)和来自GitHub的通用数据集(3,917个构建文件),总计13,343个Maven构建文件,用于研究大语言模型在构建系统代码预测中的应用效果。 论文“An Empirical Study of Next-Line Prediction in Build Systems Using CodeGen”
提供机构:
公开数据
创建时间:
2026-01-30
二维码
社区交流群
二维码
科研交流群
商业服务