benchan79/github-issues
收藏Hugging Face2023-04-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/benchan79/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
GitHub Issues数据集包含与🤗 Datasets仓库相关的GitHub问题和拉取请求。该数据集旨在用于教育目的,可用于语义搜索或多标签文本分类。数据集的内容为英文,涉及NLP、计算机视觉等领域的GitHub问题和拉取请求。
提供机构:
benchan79
原始信息汇总
数据集概述
数据集名称
- 名称: Hugging Face GitHub Issues
数据集内容
- 内容: 包含GitHub问题和拉取请求,与🤗 Datasets repository相关。
- 用途: 用于教育目的,适用于语义搜索或多标签文本分类。
- 语言: 英语
- 领域: 自然语言处理、计算机视觉等领域的数据集。
数据集结构
数据字段
- url: 字符串
- repository_url: 字符串
- labels_url: 字符串
- comments_url: 字符串
- events_url: 字符串
- html_url: 字符串
- id: 整数
- node_id: 字符串
- number: 整数
- title: 字符串
- user: 结构体,包含登录名、ID、节点ID、头像URL等信息
- labels: 列表,包含标签ID、名称、颜色等
- state: 字符串
- locked: 布尔值
- assignee: 结构体,包含分配者的详细信息
- assignees: 列表,包含多个分配者的信息
- milestone: 结构体,包含里程碑的详细信息
- comments: 字符串序列
- created_at: 时间戳
- updated_at: 时间戳
- closed_at: 时间戳
- author_association: 字符串
- body: 字符串
- reactions: 结构体,包含各种反应的计数
- timeline_url: 字符串
- state_reason: 字符串
- draft: 布尔值
- pull_request: 结构体,包含拉取请求的详细信息
- is_pull_request: 布尔值
数据分割
- train: 3100个示例,总大小15437002字节
数据集大小
- 下载大小: 4434085字节
- 数据集大小: 15437002字节



