five

drewparo/bigquery-swift-unfiltered

收藏
Hugging Face2023-08-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/drewparo/bigquery-swift-unfiltered
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从GitHub仓库提取的数据,特别关注Swift代码。使用Google BigQuery提取,包含仓库名称、引用、路径和许可证等详细信息。数据提取过程专注于Swift文件,通过`.swift`扩展名识别。数据集的特征包括仓库名称、引用、路径、许可证、副本、内容、哈希值、行均值、行最大值、字母分数、自动生成、配置或测试、无关键词、少赋值等。数据集的分割包括训练集,其字节数和示例数也提供了。
提供机构:
drewparo
原始信息汇总

数据集概述

数据集摘要

该数据集包含从GitHub仓库中提取的数据,特别是针对Swift代码。数据集通过Google BigQuery提取,包含详细的仓库名称、引用、路径和许可证等信息。

数据来源

  • 初始数据收集和规范化

数据从GitHub仓库中使用Google BigQuery收集。数据集包括来自超过280万个开源仓库的数据。数据提取过程特别关注Swift文件,通过.swift扩展名识别。

  • 数据生产者

开源项目在GitHub上的开发者和贡献者。

数据集元数据

  • 数据策展人:数据通过Google BigQuery进行策展。
  • 最后更新日期:2023年8月22日
  • 数据集创建日期:2023年5月20日

许可证信息

请注意,该数据集是开源仓库的集合。每个仓库或文件可能附带其自己的许可证。始终参考每个条目关联的许可证字段。

反馈和贡献

我们欢迎反馈和贡献。如果您发现数据集中的任何问题或希望删除您的代码,请提出问题。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作