andersonbcdefg/github_issues_markdown
收藏Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/andersonbcdefg/github_issues_markdown
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text1
dtype: string
- name: text2
dtype: string
- name: label
dtype: int64
splits:
- name: train
num_bytes: 84836992
num_examples: 18565
- name: valid
num_bytes: 6778969
num_examples: 1547
- name: test
num_bytes: 5972868
num_examples: 1548
download_size: 39958866
dataset_size: 97588829
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: valid
path: data/valid-*
- split: test
path: data/test-*
---
数据集信息:
特征:
- 名称:text1,数据类型:字符串
- 名称:text2,数据类型:字符串
- 名称:label,数据类型:64位整数
数据划分:
- 划分名称:train(训练集),字节大小:84836992,样本数量:18565
- 划分名称:valid(验证集),字节大小:6778969,样本数量:1547
- 划分名称:test(测试集),字节大小:5972868,样本数量:1548
下载总大小:39958866,数据集总存储大小:97588829
配置项:
- 配置名称:default(默认配置),数据文件:
- 划分:train,路径:data/train-*
- 划分:valid,路径:data/valid-*
- 划分:test,路径:data/test-*
提供机构:
andersonbcdefg
原始信息汇总
数据集概述
数据特征
- text1: 数据类型为字符串(string)
- text2: 数据类型为字符串(string)
- label: 数据类型为64位整数(int64)
数据分割
- 训练集(train):
- 字节数: 84836992
- 样本数: 18565
- 验证集(valid):
- 字节数: 6778969
- 样本数: 1547
- 测试集(test):
- 字节数: 5972868
- 样本数: 1548
数据大小
- 下载大小: 39958866 字节
- 数据集大小: 97588829 字节
配置
- 默认配置(default):
- 训练集文件路径:
data/train-* - 验证集文件路径:
data/valid-* - 测试集文件路径:
data/test-*
- 训练集文件路径:



