aidiary/github-issues
收藏Hugging Face2024-02-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/aidiary/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了与GitHub问题相关的详细信息,涵盖了问题的URL、用户信息、标签、状态、评论、创建和更新时间等。数据集的结构包括多个字段,如url、repository_url、labels_url、comments_url、events_url、html_url、id、node_id、number、title、user、labels、state、locked、assignee、assignees、milestone、comments、created_at、updated_at、closed_at、author_association、active_lock_reason、draft、pull_request、body、reactions、timeline_url、performed_via_github_app、state_reason和is_pull_request。数据集包含一个训练集,大小为20277330字节,包含6617个示例。
该数据集包含了与GitHub问题相关的详细信息,涵盖了问题的URL、用户信息、标签、状态、评论、创建和更新时间等。数据集的结构包括多个字段,如url、repository_url、labels_url、comments_url、events_url、html_url、id、node_id、number、title、user、labels、state、locked、assignee、assignees、milestone、comments、created_at、updated_at、closed_at、author_association、active_lock_reason、draft、pull_request、body、reactions、timeline_url、performed_via_github_app、state_reason和is_pull_request。数据集包含一个训练集,大小为20277330字节,包含6617个示例。
提供机构:
aidiary
原始信息汇总
数据集概述
数据集特征
- url: 字符串类型
- repository_url: 字符串类型
- labels_url: 字符串类型
- comments_url: 字符串类型
- events_url: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- node_id: 字符串类型
- number: 64位整数类型
- title: 字符串类型
- user: 结构体类型,包含以下字段:
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- labels: 列表类型,包含以下字段:
- color: 字符串类型
- default: 布尔类型
- description: 字符串类型
- id: 64位整数类型
- name: 字符串类型
- node_id: 字符串类型
- url: 字符串类型
- state: 字符串类型
- locked: 布尔类型
- assignee: 结构体类型,包含以下字段:
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- assignees: 列表类型,包含以下字段:
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- milestone: 结构体类型,包含以下字段:
- closed_at: 字符串类型
- closed_issues: 64位整数类型
- created_at: 字符串类型
- creator: 结构体类型,包含以下字段:
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- description: 字符串类型
- due_on: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- labels_url: 字符串类型
- node_id: 字符串类型
- number: 64位整数类型
- open_issues: 64位整数类型
- state: 字符串类型
- title: 字符串类型
- updated_at: 字符串类型
- url: 字符串类型
- comments: 64位整数类型
- created_at: 时间戳类型,UTC时区
- updated_at: 时间戳类型,UTC时区
- closed_at: 时间戳类型,UTC时区
- author_association: 字符串类型
- active_lock_reason: 64位浮点数类型
- draft: 64位浮点数类型
- pull_request: 结构体类型,包含以下字段:
- diff_url: 字符串类型
- html_url: 字符串类型
- merged_at: 字符串类型
- patch_url: 字符串类型
- url: 字符串类型
- body: 字符串类型
- reactions: 结构体类型,包含以下字段:
- +1: 64位整数类型
- -1: 64位整数类型
- confused: 64位整数类型
- eyes: 64位整数类型
- heart: 64位整数类型
- hooray: 64位整数类型
- laugh: 64位整数类型
- rocket: 64位整数类型
- total_count: 64位整数类型
- url: 字符串类型
- timeline_url: 字符串类型
- performed_via_github_app: 64位浮点数类型
- state_reason: 字符串类型
- is_pull_request: 布尔类型
数据集分割
- train: 包含6617个样本,总字节数为20277330
数据集大小
- 下载大小: 4947918字节
- 数据集大小: 20277330字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



