Google BigQuery GitHub dataset
收藏arXiv2025-09-30 收录
下载链接:
https://bigquery.cloud.google.com/dataset/bigquery-public-data:github_repos
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了用于评估和比较文件名伪装度量的GitHub仓库。在筛选过程中,数据集被限定为至少包含五个项目的目录,并从中共抽取了5,000个目录。这些目录主要来自中等规模的仓库,其项目数量在10到500个之间。该数据集的任务是对GitHub仓库中的本地文件和抽样文件的伪装得分进行评估和比较。
提供机构:
Google BigQuery



