cpeng89/github-issues-hg_datasets
收藏Hugging Face2024-07-09 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/cpeng89/github-issues-hg_datasets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与GitHub仓库相关的信息,涵盖了各种URL、用户信息、标签、状态、评论、时间戳等字段。数据集包含一个训练集,大小为39552804字节,包含6993个样本。数据集的下载大小为11528432字节。
This dataset contains information related to GitHub repositories, including various URLs, user information, labels, statuses, comments, timestamps, and other fields. The dataset includes a training set with a size of 39552804 bytes, containing 6993 samples. The download size of the dataset is 11528432 bytes.
提供机构:
cpeng89
原始信息汇总
数据集概述
数据集信息
特征
- url: 字符串类型
- repository_url: 字符串类型
- labels_url: 字符串类型
- comments_url: 字符串类型
- events_url: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- node_id: 字符串类型
- number: 64位整数类型
- title: 字符串类型
- user: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- labels: 列表类型
- color: 字符串类型
- default: 布尔类型
- description: 字符串类型
- id: 64位整数类型
- name: 字符串类型
- node_id: 字符串类型
- url: 字符串类型
- state: 字符串类型
- locked: 布尔类型
- assignee: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- assignees: 列表类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- milestone: 结构体类型
- closed_at: 字符串类型
- closed_issues: 64位整数类型
- created_at: 字符串类型
- creator: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- description: 字符串类型
- due_on: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- labels_url: 字符串类型
- node_id: 字符串类型
- number: 64位整数类型
- open_issues: 64位整数类型
- state: 字符串类型
- title: 字符串类型
- updated_at: 字符串类型
- url: 字符串类型
- comments: 字符串序列类型
- created_at: 时间戳类型(纳秒,UTC时区)
- updated_at: 时间戳类型(纳秒,UTC时区)
- closed_at: 时间戳类型(纳秒,UTC时区)
- author_association: 字符串类型
- active_lock_reason: 64位浮点数类型
- draft: 64位浮点数类型
- pull_request: 结构体类型
- diff_url: 字符串类型
- html_url: 字符串类型
- merged_at: 字符串类型
- patch_url: 字符串类型
- url: 字符串类型
- body: 字符串类型
- reactions: 结构体类型
- +1: 64位整数类型
- -1: 64位整数类型
- confused: 64位整数类型
- eyes: 64位整数类型
- heart: 64位整数类型
- hooray: 64位整数类型
- laugh: 64位整数类型
- rocket: 64位整数类型
- total_count: 64位整数类型
- url: 字符串类型
- timeline_url: 字符串类型
- performed_via_github_app: 64位浮点数类型
- state_reason: 字符串类型
- is_pull_request: 布尔类型
数据集分割
- train:
- 字节数: 39552804
- 样本数: 6993
数据集大小
- 下载大小: 11528432 字节
- 数据集大小: 39552804 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



