five

stojchet/java-deepseek-coder-1.3b-base-empty-10

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/stojchet/java-deepseek-coder-1.3b-base-empty-10
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置:humaneval和mbxp。每个配置都包含任务ID、语言、完成情况和提示信息,数据类型均为字符串。humaneval配置的训练集包含1610个示例,总字节数为2779770,下载大小为120047。mbxp配置的训练集包含9660个示例,总字节数为12522350,下载大小为523617。

The dataset includes two configurations: humaneval and mbxp. Each configuration contains features such as task_id, language, completion, and prompt, all of which are of string type. The humaneval configurations training set includes 1610 examples with a total of 2779770 bytes and a download size of 120047. The mbxp configurations training set includes 9660 examples with a total of 12522350 bytes and a download size of 523617.
提供机构:
stojchet
原始信息汇总

数据集概述

数据集配置

配置 1: humaneval

  • 特征:
    • task_id: 类型为 string
    • language: 类型为 string
    • completion: 类型为 string
    • prompt: 类型为 string
  • 分割:
    • train:
      • 字节数: 2,779,770
      • 样本数: 1,610
  • 下载大小: 120,047 字节
  • 数据集大小: 2,779,770 字节
  • 数据文件:
    • train: humaneval/train-*

配置 2: mbxp

  • 特征:
    • task_id: 类型为 string
    • language: 类型为 string
    • completion: 类型为 string
    • prompt: 类型为 string
  • 分割:
    • train:
      • 字节数: 12,522,350
      • 样本数: 9,660
  • 下载大小: 523,617 字节
  • 数据集大小: 12,522,350 字节
  • 数据文件:
    • train: mbxp/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作