h1alexbel/srdataset
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/h1alexbel/srdataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置都有不同的特征,主要涉及GitHub仓库的相关信息,如仓库名称、发布次数、贡献者数量、拉取请求、提交、问题、分支和工作流等。数据集分为多个配置,每个配置都有一个训练集分割,适用于与GitHub仓库相关的数据分析任务。
This dataset contains multiple configurations, each with different features primarily related to GitHub repositories, such as repository name, number of releases, number of contributors, pull requests, commits, issues, branches, and workflows. The dataset is divided into multiple configurations, each with a training split, suitable for data analysis tasks related to GitHub repositories.
提供机构:
h1alexbel
原始信息汇总
数据集概述
数据集配置
默认配置 (default)
- 特征:
repo: 字符串releases: 64位整数contributors: 64位整数pulls: 64位整数commits: 64位整数issues: 64位整数branches: 64位整数workflows: 64位整数
- 分割:
train:- 字节数: 366422
- 样本数: 4456
- 下载大小: 176973 字节
- 数据集大小: 366422 字节
过滤配置 (filtered)
- 特征:
repo: 字符串readme: 字符串description: 字符串topics: 字符串releases: 64位整数contributors: 64位整数pulls: 64位整数commits: 64位整数issues: 64位整数branches: 64位整数workflows: 64位整数
- 分割:
train:- 字节数: 33669099
- 样本数: 3316
- 下载大小: 16993942 字节
- 数据集大小: 33669099 字节
数值配置 (numerical)
- 特征:
repo: 字符串releases: 64位整数contributors: 64位整数pulls: 64位整数commits: 64位整数issues: 64位整数branches: 64位整数workflows: 64位整数
- 分割:
train:- 字节数: 366422
- 样本数: 4456
- 下载大小: 176973 字节
- 数据集大小: 366422 字节
仓库配置 (repos)
- 特征:
repo: 字符串readme: 字符串description: 字符串topics: 字符串releases: 64位整数contributors: 64位整数pulls: 64位整数commits: 64位整数issues: 64位整数branches: 64位整数workflows: 64位整数
- 分割:
train:- 字节数: 61616341
- 样本数: 4456
- 下载大小: 28734136 字节
- 数据集大小: 61616341 字节
相似配置 (similar)
- 特征:
head: 字符串dimension: 字符串similar: 字符串
- 分割:
train:- 字节数: 502
- 样本数: 1
- 下载大小: 4826 字节
- 数据集大小: 502 字节
文本嵌入配置 (text-embeddings)
- 特征:
0到383: 64位浮点数
- 分割:
train:- 字节数: 1536000
- 样本数: 500
- 下载大小: 1786517 字节
- 数据集大小: 1536000 字节
文本配置 (texts)
- 特征:
text: 字符串repo: 字符串
- 分割:
train:- 字节数: 33539456
- 样本数: 3316
- 下载大小: 16862065 字节
- 数据集大小: 33539456 字节



