five

ytzi/the-stack-v2-dedup-racket-macros

收藏
Hugging Face2024-05-07 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ytzi/the-stack-v2-dedup-racket-macros
下载链接
链接失效反馈
官方服务:
资源简介:
这是`the-stack-v2`中的一个Racket代码子集,包含所有至少有一个`define-syntax`的代码库。

这是`the-stack-v2`中的一个Racket代码子集,包含所有至少有一个`define-syntax`的代码库。
提供机构:
ytzi
原始信息汇总

数据集概述

数据集特征

  • blob_id: 字符串
  • directory_id: 字符串
  • path: 字符串
  • content_id: 字符串
  • detected_licenses: 字符串序列
  • license_type: 字符串
  • repo_name: 字符串
  • snapshot_id: 字符串
  • revision_id: 字符串
  • branch_name: 字符串
  • visit_date: 时间戳(纳秒)
  • revision_date: 时间戳(纳秒)
  • committer_date: 时间戳(纳秒)
  • github_id: 整数(64位)
  • star_events_count: 整数(64位)
  • fork_events_count: 整数(64位)
  • gha_license_id: 字符串
  • gha_event_created_at: 时间戳(纳秒)
  • gha_created_at: 时间戳(纳秒)
  • gha_language: 字符串
  • src_encoding: 字符串
  • language: 字符串
  • is_vendor: 布尔值
  • is_generated: 布尔值
  • length_bytes: 整数(64位)
  • extension: 字符串
  • filename: 字符串
  • content: 字符串
  • has_macro_def: 布尔值

数据集分割

  • train:
    • 字节数: 1351240538.9453108
    • 示例数: 125018

数据集大小

  • 下载大小: 425368775 字节
  • 数据集大小: 1351240538.9453108 字节

配置

  • config_name: default
    • data_files:
      • split: train
        • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作