five

PurCL/bincorp-26m-all

收藏
Hugging Face2023-08-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/PurCL/bincorp-26m-all
下载链接
链接失效反馈
官方服务:
资源简介:
--- viewer: true configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* - split: valid path: data/valid-* dataset_info: features: - name: code dtype: string - name: data_dep dtype: string splits: - name: train num_bytes: 39826202125.70429 num_examples: 14019961 - name: test num_bytes: 11713589027.6 num_examples: 4123518 - name: valid num_bytes: 7028153984.695704 num_examples: 2474111 download_size: 19420221346 dataset_size: 58567945137.99999 --- # Dataset Card for "bincorp-26m-all" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集查看器:已启用 配置列表: - 配置名称:default 数据文件: - 拆分:训练集(train),路径:data/train-* - 拆分:测试集(test),路径:data/test-* - 拆分:验证集(valid),路径:data/valid-* 数据集信息: 特征字段: - 字段名:code,数据类型:字符串(string) - 字段名:data_dep,数据类型:字符串(string) 数据拆分: - 拆分名称:训练集(train),字节大小:39826202125.70429,样本数量:14019961 - 拆分名称:测试集(test),字节大小:11713589027.6,样本数量:4123518 - 拆分名称:验证集(valid),字节大小:7028153984.695704,样本数量:2474111 下载总大小:19420221346 数据集总大小:58567945137.99999 --- # 「bincorp-26m-all」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
PurCL
原始信息汇总

数据集概述

数据集名称

  • bincorp-26m-all

数据集配置

  • 默认配置
    • 数据文件路径:
      • 训练集:data/train-*
      • 测试集:data/test-*
      • 验证集:data/valid-*

数据集特征

  • 特征名称:code
    • 数据类型:string
  • 特征名称:data_dep
    • 数据类型:string

数据集划分

  • 训练集
    • 字节数:39826202125.70429
    • 样本数:14019961
  • 测试集
    • 字节数:11713589027.6
    • 样本数:4123518
  • 验证集
    • 字节数:7028153984.695704
    • 样本数:2474111

数据集大小

  • 下载大小:19420221346
  • 数据集大小:58567945137.99999
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作