five

Google BigQuery GitHub dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://bigquery.cloud.google.com/dataset/bigquery-public-data:github_repos
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了用于评估和比较文件名伪装度量的GitHub仓库。在筛选过程中,数据集被限定为至少包含五个项目的目录,并从中共抽取了5,000个目录。这些目录主要来自中等规模的仓库,其项目数量在10到500个之间。该数据集的任务是对GitHub仓库中的本地文件和抽样文件的伪装得分进行评估和比较。
提供机构:
Google BigQuery
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作