OBF/obf-ds
收藏Hugging Face2024-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/OBF/obf-ds
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: c
features:
- name: content
dtype: string
splits:
- name: train
num_bytes: 2957472956
num_examples: 1587553
download_size: 1315296009
dataset_size: 2957472956
- config_name: cpp
features:
- name: content
dtype: string
splits:
- name: train
num_bytes: 3361552037
num_examples: 2122470
download_size: 1496021340
dataset_size: 3361552037
- config_name: go
features:
- name: content
dtype: string
splits:
- name: train
num_bytes: 1931657166
num_examples: 2782174
download_size: 995181584
dataset_size: 1931657166
- config_name: haskell
features:
- name: content
dtype: string
splits:
- name: train
num_bytes: 30961378
num_examples: 37880
download_size: 14814843
dataset_size: 30961378
- config_name: java
features:
- name: content
dtype: string
splits:
- name: train
num_bytes: 25418472045
num_examples: 8235479
download_size: 8836475462
dataset_size: 25418472045
- config_name: python
features:
- name: content
dtype: string
splits:
- name: train
num_bytes: 7357850062
num_examples: 7014356
download_size: 3117072382
dataset_size: 7357850062
- config_name: rust
features:
- name: content
dtype: string
splits:
- name: train
num_bytes: 629532272
num_examples: 566517
download_size: 283080323
dataset_size: 629532272
- config_name: typescript
features:
- name: content
dtype: string
splits:
- name: train
num_bytes: 70534602
num_examples: 20149
download_size: 26320348
dataset_size: 70534602
configs:
- config_name: c
data_files:
- split: train
path: c/train-*
- config_name: cpp
data_files:
- split: train
path: cpp/train-*
- config_name: go
data_files:
- split: train
path: go/train-*
- config_name: haskell
data_files:
- split: train
path: haskell/train-*
- config_name: java
data_files:
- split: train
path: java/train-*
- config_name: python
data_files:
- split: train
path: python/train-*
- config_name: rust
data_files:
- split: train
path: rust/train-*
- config_name: typescript
data_files:
- split: train
path: typescript/train-*
---
提供机构:
OBF
原始信息汇总
数据集概述
配置信息
C语言
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 2957472956
- 样本数: 1587553
- 下载大小: 1315296009
- 数据集大小: 2957472956
C++
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 3361552037
- 样本数: 2122470
- 下载大小: 1496021340
- 数据集大小: 3361552037
Go
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 1931657166
- 样本数: 2782174
- 下载大小: 995181584
- 数据集大小: 1931657166
Haskell
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 30961378
- 样本数: 37880
- 下载大小: 14814843
- 数据集大小: 30961378
Java
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 25418472045
- 样本数: 8235479
- 下载大小: 8836475462
- 数据集大小: 25418472045
Python
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 7357850062
- 样本数: 7014356
- 下载大小: 3117072382
- 数据集大小: 7357850062
Rust
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 629532272
- 样本数: 566517
- 下载大小: 283080323
- 数据集大小: 629532272
TypeScript
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 70534602
- 样本数: 20149
- 下载大小: 26320348
- 数据集大小: 70534602
数据文件路径
-
C语言:
- 分割: train
- 路径: c/train-*
-
C++:
- 分割: train
- 路径: cpp/train-*
-
Go:
- 分割: train
- 路径: go/train-*
-
Haskell:
- 分割: train
- 路径: haskell/train-*
-
Java:
- 分割: train
- 路径: java/train-*
-
Python:
- 分割: train
- 路径: python/train-*
-
Rust:
- 分割: train
- 路径: rust/train-*
-
TypeScript:
- 分割: train
- 路径: typescript/train-*



