susnato/PR_comments
收藏Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/susnato/PR_comments
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: repo_name
dtype: string
- name: pr_number
dtype: int64
- name: pr_title
dtype: string
- name: pr_description
dtype: string
- name: author
dtype: 'null'
- name: date_created
dtype: string
- name: date_merged
dtype: string
- name: filepath
dtype: string
- name: before_content
dtype: string
- name: after_content
dtype: string
- name: pr_author
dtype: string
- name: previous_commit
dtype: string
- name: pr_commit
dtype: string
- name: comment
dtype: string
- name: comment_author
dtype: string
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 879064359
num_examples: 12646
download_size: 117418842
dataset_size: 879064359
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
susnato
原始信息汇总
数据集概述
数据特征
- repo_name: 仓库名称,数据类型为字符串。
- pr_number: 拉取请求编号,数据类型为整数。
- pr_title: 拉取请求标题,数据类型为字符串。
- pr_description: 拉取请求描述,数据类型为字符串。
- author: 作者,数据类型为空。
- date_created: 创建日期,数据类型为字符串。
- date_merged: 合并日期,数据类型为字符串。
- filepath: 文件路径,数据类型为字符串。
- before_content: 修改前内容,数据类型为字符串。
- after_content: 修改后内容,数据类型为字符串。
- pr_author: 拉取请求作者,数据类型为字符串。
- previous_commit: 前一次提交,数据类型为字符串。
- pr_commit: 拉取请求提交,数据类型为字符串。
- comment: 评论,数据类型为字符串。
- comment_author: 评论作者,数据类型为字符串。
- index_level_0: 索引级别,数据类型为整数。
数据分割
- train: 训练集,包含12646个样本,总字节数为879064359。
数据集大小
- 下载大小: 117418842字节
- 数据集大小: 879064359字节
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



