five

benchan79/github-issues

收藏
Hugging Face2023-04-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/benchan79/github-issues
下载链接
链接失效反馈
官方服务:
资源简介:
GitHub Issues数据集包含与🤗 Datasets仓库相关的GitHub问题和拉取请求。该数据集旨在用于教育目的,可用于语义搜索或多标签文本分类。数据集的内容为英文,涉及NLP、计算机视觉等领域的GitHub问题和拉取请求。
提供机构:
benchan79
原始信息汇总

数据集概述

数据集名称

  • 名称: Hugging Face GitHub Issues

数据集内容

  • 内容: 包含GitHub问题和拉取请求,与🤗 Datasets repository相关。
  • 用途: 用于教育目的,适用于语义搜索或多标签文本分类。
  • 语言: 英语
  • 领域: 自然语言处理、计算机视觉等领域的数据集。

数据集结构

数据字段
  • url: 字符串
  • repository_url: 字符串
  • labels_url: 字符串
  • comments_url: 字符串
  • events_url: 字符串
  • html_url: 字符串
  • id: 整数
  • node_id: 字符串
  • number: 整数
  • title: 字符串
  • user: 结构体,包含登录名、ID、节点ID、头像URL等信息
  • labels: 列表,包含标签ID、名称、颜色等
  • state: 字符串
  • locked: 布尔值
  • assignee: 结构体,包含分配者的详细信息
  • assignees: 列表,包含多个分配者的信息
  • milestone: 结构体,包含里程碑的详细信息
  • comments: 字符串序列
  • created_at: 时间戳
  • updated_at: 时间戳
  • closed_at: 时间戳
  • author_association: 字符串
  • body: 字符串
  • reactions: 结构体,包含各种反应的计数
  • timeline_url: 字符串
  • state_reason: 字符串
  • draft: 布尔值
  • pull_request: 结构体,包含拉取请求的详细信息
  • is_pull_request: 布尔值
数据分割
  • train: 3100个示例,总大小15437002字节

数据集大小

  • 下载大小: 4434085字节
  • 数据集大小: 15437002字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作