five

mxeval/mxeval

收藏
Hugging Face2023-03-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mxeval/mxeval
下载链接
链接失效反馈
官方服务:
资源简介:
MxEval数据集是一个用于多语言代码生成模型执行评估的数据集。它包含多个编程语言的编程问题,并且问题中的注释和文档字符串使用英文自然文本。数据集支持的任务包括MBXP、Multi-HumanEval和MathQA-X。数据集的创建是为了评估代码生成模型的性能,确保这些模型在生成代码时不会引入问题。数据集的结构包括任务ID、语言、提示、测试、入口点等字段,并且数据被分割为不同的编程语言。

MxEval数据集是一个用于多语言代码生成模型执行评估的数据集。它包含多个编程语言的编程问题,并且问题中的注释和文档字符串使用英文自然文本。数据集支持的任务包括MBXP、Multi-HumanEval和MathQA-X。数据集的创建是为了评估代码生成模型的性能,确保这些模型在生成代码时不会引入问题。数据集的结构包括任务ID、语言、提示、测试、入口点等字段,并且数据被分割为不同的编程语言。
提供机构:
mxeval
原始信息汇总

数据集概述

数据集基本信息

  • 名称: MxEval
  • 许可证: Apache-2.0
  • 任务类别: text-generation
  • 标签: mxeval, code-generation, mbxp, multi-humaneval, mathqax
  • 语言: en

数据集结构

  • 特征:
    • task_id: 字符串
    • language: 字符串
    • prompt: 字符串
    • test: 字符串
    • entry_point: 字符串
  • 数据分割:
    • multilingual-humaneval_python: 164个样本,数据大小165716字节
  • 下载大小: 67983字节
  • 数据集大小: 165716字节

数据集内容

  • 支持的任务和排行榜:
    • MBXP
    • Multi-HumanEval
    • MathQA-X
  • 语言: 编程问题使用多种编程语言,包含英文自然文本

数据集实例

  • 示例: python { "task_id": "MBSCP/6", "language": "scala", "prompt": "...", "test": "...", "entry_point": "differAtOneBitPos", "description": "Write a Scala function to check whether the two numbers differ at one bit position only or not." }

数据集字段

  • task_id: 数据样本的标识符
  • prompt: 包含函数头和文档字符串的模型输入
  • canonical_solution: prompt中问题的解决方案
  • description: 任务描述
  • test: 包含用于测试生成的代码正确性的函数
  • entry_point: 测试的入口点
  • language: 调用适当子进程调用以执行程序的编程语言标识符

数据分割

  • HumanXEval: Python, Java, JavaScript, Csharp, CPP, Go, Kotlin, PHP, Perl, Ruby, Swift, Scala
  • MBXP: Python, Java, JavaScript, TypeScript, Csharp, CPP, Go, Kotlin, PHP, Perl, Ruby, Swift, Scala
  • MathQA: Python, Java, JavaScript
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作