OBF/contest-passed-samples
收藏Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/OBF/contest-passed-samples
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种编程语言的代码内容,涵盖了C、C++、C#、D、Go、Haskell、Java、JavaScript、Julia、Kotlin、PHP、Python、Ruby、Rust、Scala、Swift和TypeScript。每个语言的数据集都包含一个名为content的字符串特征,并且所有数据都只有一个train分割。数据集的大小和下载大小因语言而异,具体信息可在README文件中查看。
该数据集包含多种编程语言的代码内容,涵盖了C、C++、C#、D、Go、Haskell、Java、JavaScript、Julia、Kotlin、PHP、Python、Ruby、Rust、Scala、Swift和TypeScript。每个语言的数据集都包含一个名为content的字符串特征,并且所有数据都只有一个train分割。数据集的大小和下载大小因语言而异,具体信息可在README文件中查看。
提供机构:
OBF
原始信息汇总
数据集概述
数据集配置信息
C
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 156639565
- 样本数: 207238
- 下载大小: 64950019
- 数据集大小: 156639565
C++
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 910672622
- 样本数: 728924
- 下载大小: 418773306
- 数据集大小: 910672622
C#
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 96598999
- 样本数: 63292
- 下载大小: 30177567
- 数据集大小: 96598999
D
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 6087578
- 样本数: 6957
- 下载大小: 2457668
- 数据集大小: 6087578
Go
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 10932442
- 样本数: 14534
- 下载大小: 4467434
- 数据集大小: 10932442
Haskell
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 19868160
- 样本数: 36709
- 下载大小: 8822148
- 数据集大小: 19868160
Java
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 491585062
- 样本数: 313196
- 下载大小: 174444095
- 数据集大小: 491585062
JavaScript
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 14174026
- 样本数: 22962
- 下载大小: 5799613
- 数据集大小: 14174026
Julia
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 1160100
- 样本数: 3410
- 下载大小: 503328
- 数据集大小: 1160100
Kotlin
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 7746876
- 样本数: 11636
- 下载大小: 2922306
- 数据集大小: 7746876
PHP
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 7789714
- 样本数: 16353
- 下载大小: 3229847
- 数据集大小: 7789714
Python
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 576852508
- 样本数: 1225624
- 下载大小: 241813130
- 数据集大小: 576852508
Ruby
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 30450216
- 样本数: 106124
- 下载大小: 14020141
- 数据集大小: 30450216
Rust
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 15844013
- 样本数: 11174
- 下载大小: 5785746
- 数据集大小: 15844013
Scala
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 5193115
- 样本数: 8487
- 下载大小: 2053399
- 数据集大小: 5193115
Swift
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 756444
- 样本数: 1739
- 下载大小: 302746
- 数据集大小: 756444
TypeScript
- 特征:
- 名称: content
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 1029076
- 样本数: 1671
- 下载大小: 403980
- 数据集大小: 1029076
数据文件路径
C
- 分割: train
- 路径: c/train-*
C++
- 分割: train
- 路径: cpp/train-*
C#
- 分割: train
- 路径: csharp/train-*
D
- 分割: train
- 路径: d/train-*
Go
- 分割: train
- 路径: go/train-*
Haskell
- 分割: train
- 路径: haskell/train-*
Java
- 分割: train
- 路径: java/train-*
JavaScript
- 分割: train
- 路径: javascript/train-*
Julia
- 分割: train
- 路径: julia/train-*
Kotlin
- 分割: train
- 路径: kotlin/train-*
PHP
- 分割: train
- 路径: php/train-*
Python
- 分割: train
- 路径: python/train-*
Ruby
- 分割: train
- 路径: ruby/train-*
Rust
- 分割: train
- 路径: rust/train-*
Scala
- 分割: train
- 路径: scala/train-*
Swift
- 分割: train
- 路径: swift/train-*
TypeScript
- 分割: train
- 路径: typescript/train-*



