five

lorisrossi/github-issues

收藏
Hugging Face2024-02-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lorisrossi/github-issues
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集仅用于测试。它包含与🤗 Datasets仓库相关的GitHub问题和拉取请求。可以用于语义搜索或多标签文本分类。每个GitHub问题的内容均为英文。
提供机构:
lorisrossi
原始信息汇总

数据集概述

基本信息

  • 名称: HuggingFace Datasets GitHub Issues
  • 语言: 英语
  • 数据量: 1K<n<10K
  • 任务类别: 文本分类
  • 任务ID: 多标签分类

数据结构

  • 特征:
    • url: 字符串
    • repository_url: 字符串
    • labels_url: 字符串
    • comments_url: 字符串
    • events_url: 字符串
    • html_url: 字符串
    • id: 整数64位
    • node_id: 字符串
    • number: 整数64位
    • title: 字符串
    • user: 结构体
      • login: 字符串
      • id: 整数64位
      • node_id: 字符串
      • avatar_url: 字符串
      • gravatar_id: 字符串
      • url: 字符串
      • html_url: 字符串
      • followers_url: 字符串
      • following_url: 字符串
      • gists_url: 字符串
      • starred_url: 字符串
      • subscriptions_url: 字符串
      • organizations_url: 字符串
      • repos_url: 字符串
      • events_url: 字符串
      • received_events_url: 字符串
      • type: 字符串
      • site_admin: 布尔值
    • labels: 列表
      • id: 整数64位
      • node_id: 字符串
      • url: 字符串
      • name: 字符串
      • color: 字符串
      • default: 布尔值
      • description: 字符串
    • state: 字符串
    • locked: 布尔值
    • assignee: 结构体
      • login: 字符串
      • id: 整数64位
      • node_id: 字符串
      • avatar_url: 字符串
      • gravatar_id: 字符串
      • url: 字符串
      • html_url: 字符串
      • followers_url: 字符串
      • following_url: 字符串
      • gists_url: 字符串
      • starred_url: 字符串
      • subscriptions_url: 字符串
      • organizations_url: 字符串
      • repos_url: 字符串
      • events_url: 字符串
      • received_events_url: 字符串
      • type: 字符串
      • site_admin: 布尔值
    • assignees: 列表
      • login: 字符串
      • id: 整数64位
      • node_id: 字符串
      • avatar_url: 字符串
      • gravatar_id: 字符串
      • url: 字符串
      • html_url: 字符串
      • followers_url: 字符串
      • following_url: 字符串
      • gists_url: 字符串
      • starred_url: 字符串
      • subscriptions_url: 字符串
      • organizations_url: 字符串
      • repos_url: 字符串
      • events_url: 字符串
      • received_events_url: 字符串
      • type: 字符串
      • site_admin: 布尔值
    • milestone: 结构体
      • url: 字符串
      • html_url: 字符串
      • labels_url: 字符串
      • id: 整数64位
      • node_id: 字符串
      • number: 整数64位
      • title: 字符串
      • description: 字符串
      • creator: 结构体
        • login: 字符串
        • id: 整数64位
        • node_id: 字符串
        • avatar_url: 字符串
        • gravatar_id: 字符串
        • url: 字符串
        • html_url: 字符串
        • followers_url: 字符串
        • following_url: 字符串
        • gists_url: 字符串
        • starred_url: 字符串
        • subscriptions_url: 字符串
        • organizations_url: 字符串
        • repos_url: 字符串
        • events_url: 字符串
        • received_events_url: 字符串
        • type: 字符串
        • site_admin: 布尔值
      • open_issues: 整数64位
      • closed_issues: 整数64位
      • state: 字符串
      • created_at: 时间戳[秒]
      • updated_at: 时间戳[秒]
      • due_on: 空
      • closed_at: 空
    • comments: 字符串序列
    • created_at: 时间戳[秒]
    • updated_at: 时间戳[秒]
    • closed_at: 时间戳[秒]
    • author_association: 字符串
    • active_lock_reason: 空
    • body: 字符串
    • reactions: 结构体
      • url: 字符串
      • total_count: 整数64位
      • +1: 整数64位
      • -1: 整数64位
      • laugh: 整数64位
      • hooray: 整数64位
      • confused: 整数64位
      • heart: 整数64位
      • rocket: 整数64位
      • eyes: 整数64位
    • timeline_url: 字符串
    • performed_via_github_app: 空
    • state_reason: 字符串
    • draft: 布尔值
    • pull_request: 结构体
      • url: 字符串
      • html_url: 字符串
      • diff_url: 字符串
      • patch_url: 字符串
      • merged_at: 时间戳[秒]
    • is_pull_request: 布尔值

数据分割

  • train:
    • 文件大小: 26192134 字节
    • 样本数量: 3817

下载信息

  • 下载大小: 7664986 字节
  • 数据集大小: 26192134 字节

配置

  • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作