siqizhu/gh-issues
收藏Hugging Face2023-07-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/siqizhu/gh-issues
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: number
dtype: int64
- name: title
dtype: string
- name: body
dtype: string
- name: html_url
dtype: string
- name: pull_request
struct:
- name: url
dtype: string
- name: html_url
dtype: string
- name: diff_url
dtype: string
- name: patch_url
dtype: string
- name: merged_at
dtype: timestamp[s]
- name: is_pr
dtype: bool
- name: comments
sequence: string
splits:
- name: train
num_bytes: 14153081
num_examples: 4000
download_size: 5066380
dataset_size: 14153081
---
# Dataset Card for "gh-issues"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 字段名:number,数据类型:int64
- 字段名:title,数据类型:字符串(string)
- 字段名:body,数据类型:字符串(string)
- 字段名:html_url,数据类型:字符串(string)
- 字段名:pull_request(拉取请求),为结构体类型,包含子字段:
- 字段名:url,数据类型:字符串(string)
- 字段名:html_url,数据类型:字符串(string)
- 字段名:diff_url,数据类型:字符串(string)
- 字段名:patch_url,数据类型:字符串(string)
- 字段名:merged_at,数据类型:timestamp[s](秒级时间戳)
- 字段名:is_pr,数据类型:布尔值(bool)
- 字段名:comments,为字符串(string)序列类型
数据集划分:
- 划分名称:train(训练集),占用字节数:14153081,样本数量:4000
下载大小:5066380 字节,数据集总大小:14153081 字节
---
# "gh-issues"数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
siqizhu
原始信息汇总
数据集概述
数据集特征
- number: 整数类型 (int64)
- title: 字符串类型 (string)
- body: 字符串类型 (string)
- html_url: 字符串类型 (string)
- pull_request: 结构体类型,包含以下字段:
- url: 字符串类型 (string)
- html_url: 字符串类型 (string)
- diff_url: 字符串类型 (string)
- patch_url: 字符串类型 (string)
- merged_at: 时间戳类型 (timestamp[s])
- is_pr: 布尔类型 (bool)
- comments: 字符串序列类型 (sequence: string)
数据集分割
- train:
- 数据量: 14153081 字节
- 示例数量: 4000
数据集大小
- 下载大小: 5066380 字节
- 数据集大小: 14153081 字节



