CommitBench
收藏arXiv2024-03-08 更新2024-06-21 收录
下载链接:
https://zenodo.org/records/10497442,https://huggingface.co/datasets/maxscha/commitbench
下载链接
链接失效反馈官方服务:
资源简介:
CommitBench是由哈索·普拉特纳软件研究所创建的一个大规模数据集,用于训练和评估AI模型生成提交信息。该数据集包含1,664,590条高质量提交信息,来源于38,578个组织和71,676个独特项目,涵盖Java、Python、Go、JavaScript、PHP和Ruby等20种编程语言。数据集通过严格的过滤和增强技术确保数据质量,考虑了隐私、可重现性和许可证等因素。CommitBench旨在解决现有数据集在提交信息生成任务中的不足,提供一个全面的、精心策划的、关注隐私的数据集,以作为未来研究的标准基准。
提供机构:
哈索·普拉特纳软件研究所
创建时间:
2024-03-08



