runningsnake/github-issues
收藏Hugging Face2023-07-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/runningsnake/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: url
dtype: string
- name: repository_url
dtype: string
- name: labels_url
dtype: string
- name: comments_url
dtype: string
- name: events_url
dtype: string
- name: html_url
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: number
dtype: int64
- name: title
dtype: string
- name: user
struct:
- name: login
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: avatar_url
dtype: string
- name: gravatar_id
dtype: string
- name: url
dtype: string
- name: html_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: organizations_url
dtype: string
- name: repos_url
dtype: string
- name: events_url
dtype: string
- name: received_events_url
dtype: string
- name: type
dtype: string
- name: site_admin
dtype: bool
- name: labels
list:
- name: id
dtype: int64
- name: node_id
dtype: string
- name: url
dtype: string
- name: name
dtype: string
- name: color
dtype: string
- name: default
dtype: bool
- name: description
dtype: string
- name: state
dtype: string
- name: locked
dtype: bool
- name: assignee
struct:
- name: login
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: avatar_url
dtype: string
- name: gravatar_id
dtype: string
- name: url
dtype: string
- name: html_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: organizations_url
dtype: string
- name: repos_url
dtype: string
- name: events_url
dtype: string
- name: received_events_url
dtype: string
- name: type
dtype: string
- name: site_admin
dtype: bool
- name: assignees
list:
- name: login
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: avatar_url
dtype: string
- name: gravatar_id
dtype: string
- name: url
dtype: string
- name: html_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: organizations_url
dtype: string
- name: repos_url
dtype: string
- name: events_url
dtype: string
- name: received_events_url
dtype: string
- name: type
dtype: string
- name: site_admin
dtype: bool
- name: milestone
struct:
- name: url
dtype: string
- name: html_url
dtype: string
- name: labels_url
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: number
dtype: int64
- name: title
dtype: string
- name: description
dtype: string
- name: creator
struct:
- name: login
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: avatar_url
dtype: string
- name: gravatar_id
dtype: string
- name: url
dtype: string
- name: html_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: organizations_url
dtype: string
- name: repos_url
dtype: string
- name: events_url
dtype: string
- name: received_events_url
dtype: string
- name: type
dtype: string
- name: site_admin
dtype: bool
- name: open_issues
dtype: int64
- name: closed_issues
dtype: int64
- name: state
dtype: string
- name: created_at
dtype: timestamp[s]
- name: updated_at
dtype: timestamp[s]
- name: due_on
dtype: 'null'
- name: closed_at
dtype: 'null'
- name: comments
sequence: string
- name: created_at
dtype: timestamp[s]
- name: updated_at
dtype: timestamp[s]
- name: closed_at
dtype: timestamp[s]
- name: author_association
dtype: string
- name: active_lock_reason
dtype: 'null'
- name: draft
dtype: bool
- name: pull_request
struct:
- name: url
dtype: string
- name: html_url
dtype: string
- name: diff_url
dtype: string
- name: patch_url
dtype: string
- name: merged_at
dtype: timestamp[s]
- name: body
dtype: string
- name: reactions
struct:
- name: url
dtype: string
- name: total_count
dtype: int64
- name: '+1'
dtype: int64
- name: '-1'
dtype: int64
- name: laugh
dtype: int64
- name: hooray
dtype: int64
- name: confused
dtype: int64
- name: heart
dtype: int64
- name: rocket
dtype: int64
- name: eyes
dtype: int64
- name: timeline_url
dtype: string
- name: performed_via_github_app
dtype: 'null'
- name: state_reason
dtype: string
- name: is_pull_request
dtype: bool
splits:
- name: train
num_bytes: 14798625
num_examples: 2000
download_size: 4053110
dataset_size: 14798625
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
task_categories:
- text-retrieval
- text-classification
language:
- en
pretty_name: Hugging Face GitHub Issues
---
# Dataset Card for "github-issues"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 字段名:统一资源定位符(Uniform Resource Locator,URL)
数据类型:字符串
- 字段名:仓库URL(Repository URL)
数据类型:字符串
- 字段名:标签页URL(Labels URL)
数据类型:字符串
- 字段名:评论URL(Comments URL)
数据类型:字符串
- 字段名:事件URL(Events URL)
数据类型:字符串
- 字段名:HTML页面URL(HTML URL)
数据类型:字符串
- 字段名:ID
数据类型:64位整数
- 字段名:节点ID(Node ID)
数据类型:字符串
- 字段名:编号
数据类型:64位整数
- 字段名:标题
数据类型:字符串
- 字段名:用户
结构体:
- 字段名:登录名
数据类型:字符串
- 字段名:ID
数据类型:64位整数
- 字段名:节点ID(Node ID)
数据类型:字符串
- 字段名:头像URL(Avatar URL)
数据类型:字符串
- 字段名:Gravatar ID
数据类型:字符串
- 字段名:统一资源定位符(Uniform Resource Locator,URL)
数据类型:字符串
- 字段名:HTML页面URL(HTML URL)
数据类型:字符串
- 字段名:关注者URL(Followers URL)
数据类型:字符串
- 字段名:关注中URL(Following URL)
数据类型:字符串
- 字段名:代码片段URL(Gists URL)
数据类型:字符串
- 字段名:星标项目URL(Starred URL)
数据类型:字符串
- 字段名:订阅URL(Subscriptions URL)
数据类型:字符串
- 字段名:组织URL(Organizations URL)
数据类型:字符串
- 字段名:仓库URL(Repository URL)
数据类型:字符串
- 字段名:事件URL(Events URL)
数据类型:字符串
- 字段名:接收事件URL(Received Events URL)
数据类型:字符串
- 字段名:类型
数据类型:字符串
- 字段名:站点管理员
数据类型:布尔型
- 字段名:标签
列表:
- 字段名:ID
数据类型:64位整数
- 字段名:节点ID(Node ID)
数据类型:字符串
- 字段名:统一资源定位符(Uniform Resource Locator,URL)
数据类型:字符串
- 字段名:名称
数据类型:字符串
- 字段名:颜色代码
数据类型:字符串
- 字段名:默认标签
数据类型:布尔型
- 字段名:描述
数据类型:字符串
- 字段名:状态
数据类型:字符串
- 字段名:锁定状态
数据类型:布尔型
- 字段名:经办人
结构体:
- 字段名:登录名
数据类型:字符串
- 字段名:ID
数据类型:64位整数
- 字段名:节点ID(Node ID)
数据类型:字符串
- 字段名:头像URL(Avatar URL)
数据类型:字符串
- 字段名:Gravatar ID
数据类型:字符串
- 字段名:统一资源定位符(Uniform Resource Locator,URL)
数据类型:字符串
- 字段名:HTML页面URL(HTML URL)
数据类型:字符串
- 字段名:关注者URL(Followers URL)
数据类型:字符串
- 字段名:关注中URL(Following URL)
数据类型:字符串
- 字段名:代码片段URL(Gists URL)
数据类型:字符串
- 字段名:星标项目URL(Starred URL)
数据类型:字符串
- 字段名:订阅URL(Subscriptions URL)
数据类型:字符串
- 字段名:组织URL(Organizations URL)
数据类型:字符串
- 字段名:仓库URL(Repository URL)
数据类型:字符串
- 字段名:事件URL(Events URL)
数据类型:字符串
- 字段名:接收事件URL(Received Events URL)
数据类型:字符串
- 字段名:类型
数据类型:字符串
- 字段名:站点管理员
数据类型:布尔型
- 字段名:经办人列表
列表:
- 字段名:登录名
数据类型:字符串
- 字段名:ID
数据类型:64位整数
- 字段名:节点ID(Node ID)
数据类型:字符串
- 字段名:头像URL(Avatar URL)
数据类型:字符串
- 字段名:Gravatar ID
数据类型:字符串
- 字段名:统一资源定位符(Uniform Resource Locator,URL)
数据类型:字符串
- 字段名:HTML页面URL(HTML URL)
数据类型:字符串
- 字段名:关注者URL(Followers URL)
数据类型:字符串
- 字段名:关注中URL(Following URL)
数据类型:字符串
- 字段名:代码片段URL(Gists URL)
数据类型:字符串
- 字段名:星标项目URL(Starred URL)
数据类型:字符串
- 字段名:订阅URL(Subscriptions URL)
数据类型:字符串
- 字段名:组织URL(Organizations URL)
数据类型:字符串
- 字段名:仓库URL(Repository URL)
数据类型:字符串
- 字段名:事件URL(Events URL)
数据类型:字符串
- 字段名:接收事件URL(Received Events URL)
数据类型:字符串
- 字段名:类型
数据类型:字符串
- 字段名:站点管理员
数据类型:布尔型
- 字段名:里程碑
结构体:
- 字段名:统一资源定位符(Uniform Resource Locator,URL)
数据类型:字符串
- 字段名:HTML页面URL(HTML URL)
数据类型:字符串
- 字段名:标签页URL(Labels URL)
数据类型:字符串
- 字段名:ID
数据类型:64位整数
- 字段名:节点ID(Node ID)
数据类型:字符串
- 字段名:编号
数据类型:64位整数
- 字段名:标题
数据类型:字符串
- 字段名:描述
数据类型:字符串
- 字段名:创建者
结构体:
- 字段名:登录名
数据类型:字符串
- 字段名:ID
数据类型:64位整数
- 字段名:节点ID(Node ID)
数据类型:字符串
- 字段名:头像URL(Avatar URL)
数据类型:字符串
- 字段名:Gravatar ID
数据类型:字符串
- 字段名:统一资源定位符(Uniform Resource Locator,URL)
数据类型:字符串
- 字段名:HTML页面URL(HTML URL)
数据类型:字符串
- 字段名:关注者URL(Followers URL)
数据类型:字符串
- 字段名:关注中URL(Following URL)
数据类型:字符串
- 字段名:代码片段URL(Gists URL)
数据类型:字符串
- 字段名:星标项目URL(Starred URL)
数据类型:字符串
- 字段名:订阅URL(Subscriptions URL)
数据类型:字符串
- 字段名:组织URL(Organizations URL)
数据类型:字符串
- 字段名:仓库URL(Repository URL)
数据类型:字符串
- 字段名:事件URL(Events URL)
数据类型:字符串
- 字段名:接收事件URL(Received Events URL)
数据类型:字符串
- 字段名:类型
数据类型:字符串
- 字段名:站点管理员
数据类型:布尔型
- 字段名:未关闭议题数
数据类型:64位整数
- 字段名:已关闭议题数
数据类型:64位整数
- 字段名:状态
数据类型:字符串
- 字段名:创建时间
数据类型:秒级时间戳(Timestamp[s])
- 字段名:更新时间
数据类型:秒级时间戳(Timestamp[s])
- 字段名:截止时间
数据类型:空值
- 字段名:关闭时间
数据类型:空值
- 字段名:评论
序列:字符串序列
- 字段名:创建时间
数据类型:秒级时间戳(Timestamp[s])
- 字段名:更新时间
数据类型:秒级时间戳(Timestamp[s])
- 字段名:关闭时间
数据类型:秒级时间戳(Timestamp[s])
- 字段名:作者关联关系
数据类型:字符串
- 字段名:主动锁定原因
数据类型:空值
- 字段名:草稿状态
数据类型:布尔型
- 字段名:拉取请求(Pull Request)
结构体:
- 字段名:统一资源定位符(Uniform Resource Locator,URL)
数据类型:字符串
- 字段名:HTML页面URL(HTML URL)
数据类型:字符串
- 字段名:差异URL(Diff URL)
数据类型:字符串
- 字段名:补丁URL(Patch URL)
数据类型:字符串
- 字段名:合并时间
数据类型:秒级时间戳(Timestamp[s])
- 字段名:正文
数据类型:字符串
- 字段名:反应
结构体:
- 字段名:统一资源定位符(Uniform Resource Locator,URL)
数据类型:字符串
- 字段名:总反应数
数据类型:64位整数
- 字段名:点赞(+1)
数据类型:64位整数
- 字段名:点踩(-1)
数据类型:64位整数
- 字段名:大笑反应
数据类型:64位整数
- 字段名:欢呼反应
数据类型:64位整数
- 字段名:困惑反应
数据类型:64位整数
- 字段名:爱心反应
数据类型:64位整数
- 字段名:推广反应(火箭)
数据类型:64位整数
- 字段名:关注反应
数据类型:64位整数
- 字段名:时间线URL(Timeline URL)
数据类型:字符串
- 字段名:通过GitHub应用执行
数据类型:空值
- 字段名:状态原因
数据类型:字符串
- 字段名:是否为拉取请求
数据类型:布尔型
分割集:
- 分割集名称:训练集(train)
字节大小:14798625
样本数量:2000
下载总大小:4053110字节
数据集总大小:14798625字节
配置项:
- 配置名称:默认配置(default)
数据文件:
- 分割集:训练集(train)
路径:data/train-*
任务类别:
- 文本检索(Text Retrieval)
- 文本分类(Text Classification)
语言:英语(en)
美观名称:Hugging Face GitHub 议题数据集
# 「github-issues」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
runningsnake
原始信息汇总
数据集概述
数据集名称
- 名称:Hugging Face GitHub Issues
数据集特征
基本特征
- url:字符串类型
- repository_url:字符串类型
- labels_url:字符串类型
- comments_url:字符串类型
- events_url:字符串类型
- html_url:字符串类型
- id:整数类型
- node_id:字符串类型
- number:整数类型
- title:字符串类型
用户特征
- user:结构体类型,包含以下字段:
- login:字符串类型
- id:整数类型
- node_id:字符串类型
- avatar_url:字符串类型
- gravatar_id:字符串类型
- url:字符串类型
- html_url:字符串类型
- followers_url:字符串类型
- following_url:字符串类型
- gists_url:字符串类型
- starred_url:字符串类型
- subscriptions_url:字符串类型
- organizations_url:字符串类型
- repos_url:字符串类型
- events_url:字符串类型
- received_events_url:字符串类型
- type:字符串类型
- site_admin:布尔类型
标签特征
- labels:列表类型,包含以下字段:
- id:整数类型
- node_id:字符串类型
- url:字符串类型
- name:字符串类型
- color:字符串类型
- default:布尔类型
- description:字符串类型
状态特征
- state:字符串类型
- locked:布尔类型
分配者特征
- assignee:结构体类型,包含与用户特征相同的字段
分配者列表特征
- assignees:列表类型,包含与用户特征相同的字段
里程碑特征
- milestone:结构体类型,包含以下字段:
- url:字符串类型
- html_url:字符串类型
- labels_url:字符串类型
- id:整数类型
- node_id:字符串类型
- number:整数类型
- title:字符串类型
- description:字符串类型
- creator:结构体类型,包含与用户特征相同的字段
- open_issues:整数类型
- closed_issues:整数类型
- state:字符串类型
- created_at:时间戳类型
- updated_at:时间戳类型
- due_on:空值
- closed_at:空值
评论特征
- comments:字符串序列类型
时间特征
- created_at:时间戳类型
- updated_at:时间戳类型
- closed_at:时间戳类型
作者关联特征
- author_association:字符串类型
活动锁定原因特征
- active_lock_reason:空值
草稿特征
- draft:布尔类型
拉取请求特征
- pull_request:结构体类型,包含以下字段:
- url:字符串类型
- html_url:字符串类型
- diff_url:字符串类型
- patch_url:字符串类型
- merged_at:时间戳类型
反应特征
- reactions:结构体类型,包含以下字段:
- url:字符串类型
- total_count:整数类型
- +1:整数类型
- -1:整数类型
- laugh:整数类型
- hooray:整数类型
- confused:整数类型
- heart:整数类型
- rocket:整数类型
- eyes:整数类型
时间线URL特征
- timeline_url:字符串类型
通过GitHub应用执行特征
- performed_via_github_app:空值
状态原因特征
- state_reason:字符串类型
是否为拉取请求特征
- is_pull_request:布尔类型
数据集拆分
- train:
- 字节数:14798625
- 示例数:2000
数据集大小
- 下载大小:4053110字节
- 数据集大小:14798625字节
任务类别
- 文本检索
- 文本分类
语言
- 英语



