Code review regression analysis of open source GitHub projects
收藏Mendeley Data2024-06-25 更新2024-06-28 收录
下载链接:
https://datadryad.org/stash/dataset/doi:10.6078/D14X0T
下载链接
链接失效反馈官方服务:
资源简介:
This dataset contains the repository data used for our study "A Large-Scale Study of Modern Code Review and Security in Open Source Projects". This dataset was collected from GitHub, and includes 3,126 projects in 143 languages, with 489,038 issues and 382,771 pull requests. We also include the regression analysis notebooks for reproducing our results from this data.
本数据集包含支撑我们完成题为《开源项目中现代代码审查与安全大规模研究》"A Large-Scale Study of Modern Code Review and Security in Open Source Projects"的研究时所使用的仓库数据。该数据集采集自GitHub,涵盖143种编程语言下的3126个项目,包含489038个议题(issue)与382771个拉取请求(pull request)。此外,本数据集还附带可用于复现本研究成果的回归分析笔记本(notebook)。
创建时间:
2023-11-16
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含来自GitHub的3,126个开源项目数据,涵盖143种语言,包含489,038个问题和382,771个拉取请求。数据集用于研究现代代码审查与开源项目安全性的关系,并提供了回归分析笔记本以复现研究结果。
以上内容由遇见数据集搜集并总结生成



