rizhiyi1983/github-issues
收藏Hugging Face2024-07-16 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/rizhiyi1983/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了与GitHub问题相关的详细信息,涵盖了问题的URL、用户信息、标签、状态、评论、反应等多个方面。数据集的特征字段包括url、repository_url、labels_url、comments_url、events_url、html_url、id、node_id、number、title、user、labels、state、locked、assignee、assignees、milestone、comments、created_at、updated_at、closed_at、author_association、active_lock_reason、body、reactions、timeline_url、performed_via_github_app、state_reason、draft、pull_request、is_pull_request等。数据集的分割信息显示训练集包含7010个样本,总大小为21584002字节。
This dataset contains detailed information related to GitHub issues, covering various aspects such as issue URLs, user information, labels, status, comments, reactions, and more. The datasets feature fields include url, repository_url, labels_url, comments_url, events_url, html_url, id, node_id, number, title, user, labels, state, locked, assignee, assignees, milestone, comments, created_at, updated_at, closed_at, author_association, active_lock_reason, body, reactions, timeline_url, performed_via_github_app, state_reason, draft, pull_request, is_pull_request, etc. The datasets split information indicates that the training set contains 7010 samples with a total size of 21584002 bytes.
提供机构:
rizhiyi1983
原始信息汇总
数据集概述
数据集特征
- url: 字符串类型
- repository_url: 字符串类型
- labels_url: 字符串类型
- comments_url: 字符串类型
- events_url: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- node_id: 字符串类型
- number: 64位整数类型
- title: 字符串类型
- user: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- labels: 列表类型
- color: 字符串类型
- default: 布尔类型
- description: 字符串类型
- id: 64位整数类型
- name: 字符串类型
- node_id: 字符串类型
- url: 字符串类型
- state: 字符串类型
- locked: 布尔类型
- assignee: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- assignees: 列表类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- milestone: 结构体类型
- closed_at: 字符串类型
- closed_issues: 64位整数类型
- created_at: 字符串类型
- creator: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- description: 字符串类型
- due_on: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- labels_url: 字符串类型
- node_id: 字符串类型
- number: 64位整数类型
- open_issues: 64位整数类型
- state: 字符串类型
- title: 字符串类型
- updated_at: 字符串类型
- url: 字符串类型
- comments: 64位整数类型
- created_at: 时间戳类型(纳秒,UTC时区)
- updated_at: 时间戳类型(纳秒,UTC时区)
- closed_at: 时间戳类型(纳秒,UTC时区)
- author_association: 字符串类型
- active_lock_reason: 64位浮点数类型
- body: 字符串类型
- reactions: 结构体类型
- +1: 64位整数类型
- -1: 64位整数类型
- confused: 64位整数类型
- eyes: 64位整数类型
- heart: 64位整数类型
- hooray: 64位整数类型
- laugh: 64位整数类型
- rocket: 64位整数类型
- total_count: 64位整数类型
- url: 字符串类型
- timeline_url: 字符串类型
- performed_via_github_app: 64位浮点数类型
- state_reason: 字符串类型
- draft: 64位浮点数类型
- pull_request: 结构体类型
- diff_url: 字符串类型
- html_url: 字符串类型
- merged_at: 字符串类型
- patch_url: 字符串类型
- url: 字符串类型
- is_pull_request: 布尔类型
数据集分割
- train:
- 字节数: 21584002
- 样本数: 7010
数据集大小
- 下载大小: 5334139 字节
- 数据集大小: 21584002 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



