akumoth/peewee-issues
收藏Hugging Face2023-05-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/akumoth/peewee-issues
下载链接
链接失效反馈官方服务:
资源简介:
Peewee Issues数据集包含了Peewee GitHub仓库中的所有问题,截至提取的最后日期(2023年5月3日)。该数据集专为教育目的而创建(特别是为了熟悉使用Hugging Face的数据集),但也可用于多标签分类或语义搜索。数据集内容全部为英文,涉及SQL数据库和ORM库。
Peewee Issues数据集包含了Peewee GitHub仓库中的所有问题,截至提取的最后日期(2023年5月3日)。该数据集专为教育目的而创建(特别是为了熟悉使用Hugging Face的数据集),但也可用于多标签分类或语义搜索。数据集内容全部为英文,涉及SQL数据库和ORM库。
提供机构:
akumoth
原始信息汇总
数据集概述
数据集名称
Peewee Issues
数据集描述
Peewee Issues 是一个包含 Peewee github 仓库 中所有问题的数据集,截至最后提取日期(5/3/2023)。该数据集主要用于教育目的,特别是帮助用户熟悉使用 Hugging Face 的 datasets,也可用于多标签分类或语义搜索。数据集内容均为英文,涉及 SQL 数据库和 ORM 库。
数据集特征
基本特征
- url: 字符串类型
- repository_url: 字符串类型
- labels_url: 字符串类型
- comments_url: 字符串类型
- events_url: 字符串类型
- html_url: 字符串类型
- id: 整数类型
- node_id: 字符串类型
- number: 整数类型
- title: 字符串类型
用户特征
- user: 结构体类型,包含以下子特征:
- login: 字符串类型
- id: 整数类型
- node_id: 字符串类型
- avatar_url: 字符串类型
- gravatar_id: 字符串类型
- url: 字符串类型
- html_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- organizations_url: 字符串类型
- repos_url: 字符串类型
- events_url: 字符串类型
- received_events_url: 字符串类型
- type: 字符串类型
- site_admin: 布尔类型
其他特征
- labels: 列表类型,包含以下子特征:
- id: 整数类型
- node_id: 字符串类型
- url: 字符串类型
- name: 字符串类型
- color: 字符串类型
- default: 布尔类型
- description: 空值类型
- state: 字符串类型
- locked: 布尔类型
- assignee: 空值类型
- assignees: 空值类型
- milestone: 空值类型
- comments: 字符串类型序列
- created_at: 时间戳类型
- updated_at: 时间戳类型
- closed_at: 时间戳类型
- author_association: 字符串类型
- active_lock_reason: 字符串类型
- body: 字符串类型
- reactions: 结构体类型,包含以下子特征:
- url: 字符串类型
- total_count: 整数类型
- +1: 整数类型
- -1: 整数类型
- laugh: 整数类型
- hooray: 整数类型
- confused: 整数类型
- heart: 整数类型
- rocket: 整数类型
- eyes: 整数类型
- timeline_url: 字符串类型
- performed_via_github_app: 空值类型
- state_reason: 字符串类型
- draft: 布尔类型
- pull_request: 结构体类型,包含以下子特征:
- url: 字符串类型
- html_url: 字符串类型
- diff_url: 字符串类型
- patch_url: 字符串类型
- merged_at: 时间戳类型
数据集大小
- 下载大小: 3607838 字节
- 数据集大小: 9990717 字节
- 训练集大小: 9990717 字节,包含 2814 个样本
数据集属性
- 语言: 英文
- 许可证: MIT
- 多语言性: 单语种
- 来源: 原始数据
- 标签: Peewee, Python, Github, Issues
- 任务类别: 文本分类, 特征提取
- 任务ID: 主题分类, 多标签分类



