five

stojchet/python-d2-empty

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/stojchet/python-d2-empty
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置:humaneval和mbxp。每个配置都包含任务ID、语言、完成代码和提示等特征。humaneval配置包含164个训练样本,总大小为277053字节;mbxp配置包含974个训练样本,总大小为1354455字节。这些数据可能用于代码生成或自然语言处理任务,特别是与编程语言相关的任务。

The dataset includes two configurations: humaneval and mbxp. Each configuration contains features such as task ID, language, completion code, and prompt. The humaneval configuration includes 164 training samples with a total size of 277053 bytes; the mbxp configuration includes 974 training samples with a total size of 1354455 bytes. These data are likely used for code generation or natural language processing tasks, particularly those related to programming languages.
提供机构:
stojchet
原始信息汇总

数据集概述

数据集配置

配置1: humaneval

  • 特征:
    • task_id: 类型为字符串
    • language: 类型为字符串
    • completion: 类型为字符串
    • prompt: 类型为字符串
  • 分割:
    • train:
      • 字节数: 277053
      • 样本数: 164
  • 下载大小: 145890 字节
  • 数据集大小: 277053 字节
  • 数据文件路径:
    • train: humaneval/train-*

配置2: mbxp

  • 特征:
    • task_id: 类型为字符串
    • language: 类型为字符串
    • completion: 类型为字符串
    • prompt: 类型为字符串
  • 分割:
    • train:
      • 字节数: 1354455
      • 样本数: 974
  • 下载大小: 607559 字节
  • 数据集大小: 1354455 字节
  • 数据文件路径:
    • train: mbxp/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作