petrpan26/typescript-code
收藏Hugging Face2023-11-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/petrpan26/typescript-code
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: index
dtype: int64
- name: repo_id
dtype: string
- name: file_path
dtype: string
- name: content
dtype: string
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 2750873540
num_examples: 380000
download_size: 879130666
dataset_size: 2750873540
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
### 数据集信息
#### 特征字段
- 字段名:`index`,数据类型:64位整型(int64)
- 字段名:`repo_id`,仓库标识符,数据类型:字符串(string)
- 字段名:`file_path`,文件路径,数据类型:字符串(string)
- 字段名:`content`,文件内容,数据类型:字符串(string)
- 字段名:`__index_level_0__`,内置索引层级0,数据类型:64位整型(int64)
#### 数据集划分
- 划分名称:`train`(训练集),字节数:2750873540,样本总数:380000
#### 尺寸参数
下载大小:879130666 字节
数据集总大小:2750873540 字节
#### 配置项
- 配置名称:`default`(默认配置),数据文件配置如下:
- 对应数据集划分:`train`(训练集),文件路径:`data/train-*`
提供机构:
petrpan26
原始信息汇总
数据集概述
数据特征
- index: 数据类型为
int64 - repo_id: 数据类型为
string - file_path: 数据类型为
string - content: 数据类型为
string - index_level_0: 数据类型为
int64
数据划分
- train: 包含 380000 条数据,总字节数为 2750873540
数据集大小
- 下载大小: 879130666 字节
- 数据集大小: 2750873540 字节
配置
- default: 包含训练数据文件,路径为
data/train-*



