five

UKPLab/SLTrans

收藏
Hugging Face2024-08-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/UKPLab/SLTrans
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从编程竞赛解决方案中生成并去重后的源代码和LLVM IR对。数据集按语言配置和模式划分,语言包括C、C++、D、Fortran、Go、Haskell、Nim、Objective-C、Python、Rust和Swift,模式分为Size_Optimized和Perf_Optimized。

该数据集包含从编程竞赛解决方案中生成并去重后的源代码和LLVM IR对。数据集按语言配置和模式划分,语言包括C、C++、D、Fortran、Go、Haskell、Nim、Objective-C、Python、Rust和Swift,模式分为Size_Optimized和Perf_Optimized。
提供机构:
UKPLab
原始信息汇总

数据集概述

该数据集包含源代码和LLVM IR对,这些数据是从接受的编程竞赛解决方案中生成的,并经过去重处理。数据集按语言配置和模式分割进行划分。

支持的语言

  • C
  • C++
  • D
  • Fortran
  • Go
  • Haskell
  • Nim
  • Objective-C
  • Python
  • Rust
  • Swift

模式分割

  • Size_Optimized
  • Perf_Optimized

数据集配置详情

C

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 3383884149 bytes, 341419 examples
    • Size_Optimized: 2528286566 bytes, 341785 examples
  • 下载大小: 1323447636 bytes
  • 数据集大小: 5912170715 bytes

C++

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 116351369851 bytes, 2898509 examples
    • Size_Optimized: 92572469724 bytes, 2916655 examples
  • 下载大小: 51690627847 bytes
  • 数据集大小: 208923839575 bytes

D

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 2320830137 bytes, 7000 examples
    • Size_Optimized: 3271276765 bytes, 11054 examples
  • 下载大小: 1316382832 bytes
  • 数据集大小: 5592106902 bytes

Fortran

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 357741835 bytes, 6327 examples
    • Size_Optimized: 2320830137 bytes, 7000 examples
  • 下载大小: 563853972 bytes
  • 数据集大小: 2678571972 bytes

Go

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 819560767 bytes, 3913 examples
    • Size_Optimized: 741733997 bytes, 3925 examples
  • 下载大小: 317182680 bytes
  • 数据集大小: 1561294764 bytes

Haskell

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 3838556743 bytes, 27892 examples
    • Size_Optimized: 3667186152 bytes, 28203 examples
  • 下载大小: 1736729352 bytes
  • 数据集大小: 7505742895 bytes

Nim

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Size_Optimized: 106424381 bytes, 215 examples
  • 下载大小: 22506456 bytes
  • 数据集大小: 106424381 bytes

Objective-C

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 1729045 bytes, 283 examples
    • Size_Optimized: 1433377 bytes, 283 examples
  • 下载大小: 707508 bytes
  • 数据集大小: 3162422 bytes

Python

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 13118428652 bytes, 154507 examples
    • Size_Optimized: 13118428652 bytes, 154507 examples
  • 下载大小: 6511950536 bytes
  • 数据集大小: 26236857304 bytes

Rust

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 5859467468 bytes, 38323 examples
    • Size_Optimized: 8695405064 bytes, 32720 examples
  • 下载大小: 5326634011 bytes
  • 数据集大小: 14554872532 bytes

Swift

  • 特征:
    • Source_Code: string
    • IR_Original: string
  • 分割:
    • Perf_Optimized: 260013963 bytes, 2003 examples
    • Size_Optimized: 266356839 bytes, 2015 examples
  • 下载大小: 144113584 bytes
  • 数据集大小: 526370802 bytes
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作