five

OBF/contest-passed-samples

收藏
Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/OBF/contest-passed-samples
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多种编程语言的代码内容,涵盖了C、C++、C#、D、Go、Haskell、Java、JavaScript、Julia、Kotlin、PHP、Python、Ruby、Rust、Scala、Swift和TypeScript。每个语言的数据集都包含一个名为content的字符串特征,并且所有数据都只有一个train分割。数据集的大小和下载大小因语言而异,具体信息可在README文件中查看。

该数据集包含多种编程语言的代码内容,涵盖了C、C++、C#、D、Go、Haskell、Java、JavaScript、Julia、Kotlin、PHP、Python、Ruby、Rust、Scala、Swift和TypeScript。每个语言的数据集都包含一个名为content的字符串特征,并且所有数据都只有一个train分割。数据集的大小和下载大小因语言而异,具体信息可在README文件中查看。
提供机构:
OBF
原始信息汇总

数据集概述

数据集配置信息

C

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 156639565
    • 样本数: 207238
  • 下载大小: 64950019
  • 数据集大小: 156639565

C++

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 910672622
    • 样本数: 728924
  • 下载大小: 418773306
  • 数据集大小: 910672622

C#

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 96598999
    • 样本数: 63292
  • 下载大小: 30177567
  • 数据集大小: 96598999

D

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 6087578
    • 样本数: 6957
  • 下载大小: 2457668
  • 数据集大小: 6087578

Go

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 10932442
    • 样本数: 14534
  • 下载大小: 4467434
  • 数据集大小: 10932442

Haskell

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 19868160
    • 样本数: 36709
  • 下载大小: 8822148
  • 数据集大小: 19868160

Java

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 491585062
    • 样本数: 313196
  • 下载大小: 174444095
  • 数据集大小: 491585062

JavaScript

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 14174026
    • 样本数: 22962
  • 下载大小: 5799613
  • 数据集大小: 14174026

Julia

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 1160100
    • 样本数: 3410
  • 下载大小: 503328
  • 数据集大小: 1160100

Kotlin

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 7746876
    • 样本数: 11636
  • 下载大小: 2922306
  • 数据集大小: 7746876

PHP

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 7789714
    • 样本数: 16353
  • 下载大小: 3229847
  • 数据集大小: 7789714

Python

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 576852508
    • 样本数: 1225624
  • 下载大小: 241813130
  • 数据集大小: 576852508

Ruby

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 30450216
    • 样本数: 106124
  • 下载大小: 14020141
  • 数据集大小: 30450216

Rust

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 15844013
    • 样本数: 11174
  • 下载大小: 5785746
  • 数据集大小: 15844013

Scala

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 5193115
    • 样本数: 8487
  • 下载大小: 2053399
  • 数据集大小: 5193115

Swift

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 756444
    • 样本数: 1739
  • 下载大小: 302746
  • 数据集大小: 756444

TypeScript

  • 特征:
    • 名称: content
    • 数据类型: string
  • 分割:
    • 名称: train
    • 字节数: 1029076
    • 样本数: 1671
  • 下载大小: 403980
  • 数据集大小: 1029076

数据文件路径

C

  • 分割: train
  • 路径: c/train-*

C++

  • 分割: train
  • 路径: cpp/train-*

C#

  • 分割: train
  • 路径: csharp/train-*

D

  • 分割: train
  • 路径: d/train-*

Go

  • 分割: train
  • 路径: go/train-*

Haskell

  • 分割: train
  • 路径: haskell/train-*

Java

  • 分割: train
  • 路径: java/train-*

JavaScript

  • 分割: train
  • 路径: javascript/train-*

Julia

  • 分割: train
  • 路径: julia/train-*

Kotlin

  • 分割: train
  • 路径: kotlin/train-*

PHP

  • 分割: train
  • 路径: php/train-*

Python

  • 分割: train
  • 路径: python/train-*

Ruby

  • 分割: train
  • 路径: ruby/train-*

Rust

  • 分割: train
  • 路径: rust/train-*

Scala

  • 分割: train
  • 路径: scala/train-*

Swift

  • 分割: train
  • 路径: swift/train-*

TypeScript

  • 分割: train
  • 路径: typescript/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作