five

stojchet/java-deepseek-coder-1.3b-base-markdown-10

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/stojchet/java-deepseek-coder-1.3b-base-markdown-10
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置:humaneval和mbxp。每个配置都包含task_id、language、completion和prompt四个特征,数据类型均为字符串。humaneval配置的训练集包含1610个示例,总大小为2763000字节;mbxp配置的训练集包含9660个示例,总大小为12927080字节。

The dataset contains two configurations: humaneval and mbxp. Each configuration includes four features: task_id, language, completion, and prompt, all of which are of string type. The training set of the humaneval configuration contains 1610 examples with a total size of 2763000 bytes; the training set of the mbxp configuration contains 9660 examples with a total size of 12927080 bytes.
提供机构:
stojchet
原始信息汇总

数据集概述

数据集配置

配置名称:humaneval

特征

  • task_id: 字符串类型
  • language: 字符串类型
  • completion: 字符串类型
  • prompt: 字符串类型

数据分割

  • train:
    • 字节数: 2763000
    • 样本数: 1610

数据大小

  • 下载大小: 120904 字节
  • 数据集大小: 2763000 字节

配置名称:mbxp

特征

  • task_id: 字符串类型
  • language: 字符串类型
  • completion: 字符串类型
  • prompt: 字符串类型

数据分割

  • train:
    • 字节数: 12927080
    • 样本数: 9660

数据大小

  • 下载大小: 533913 字节
  • 数据集大小: 12927080 字节

数据文件路径

配置名称:humaneval

  • train: humaneval/train-*

配置名称:mbxp

  • train: mbxp/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作