mxeval/mxeval
收藏Hugging Face2023-03-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mxeval/mxeval
下载链接
链接失效反馈官方服务:
资源简介:
MxEval数据集是一个用于多语言代码生成模型执行评估的数据集。它包含多个编程语言的编程问题,并且问题中的注释和文档字符串使用英文自然文本。数据集支持的任务包括MBXP、Multi-HumanEval和MathQA-X。数据集的创建是为了评估代码生成模型的性能,确保这些模型在生成代码时不会引入问题。数据集的结构包括任务ID、语言、提示、测试、入口点等字段,并且数据被分割为不同的编程语言。
MxEval数据集是一个用于多语言代码生成模型执行评估的数据集。它包含多个编程语言的编程问题,并且问题中的注释和文档字符串使用英文自然文本。数据集支持的任务包括MBXP、Multi-HumanEval和MathQA-X。数据集的创建是为了评估代码生成模型的性能,确保这些模型在生成代码时不会引入问题。数据集的结构包括任务ID、语言、提示、测试、入口点等字段,并且数据被分割为不同的编程语言。
提供机构:
mxeval
原始信息汇总
数据集概述
数据集基本信息
- 名称: MxEval
- 许可证: Apache-2.0
- 任务类别: text-generation
- 标签: mxeval, code-generation, mbxp, multi-humaneval, mathqax
- 语言: en
数据集结构
- 特征:
task_id: 字符串language: 字符串prompt: 字符串test: 字符串entry_point: 字符串
- 数据分割:
multilingual-humaneval_python: 164个样本,数据大小165716字节
- 下载大小: 67983字节
- 数据集大小: 165716字节
数据集内容
- 支持的任务和排行榜:
- MBXP
- Multi-HumanEval
- MathQA-X
- 语言: 编程问题使用多种编程语言,包含英文自然文本
数据集实例
- 示例: python { "task_id": "MBSCP/6", "language": "scala", "prompt": "...", "test": "...", "entry_point": "differAtOneBitPos", "description": "Write a Scala function to check whether the two numbers differ at one bit position only or not." }
数据集字段
task_id: 数据样本的标识符prompt: 包含函数头和文档字符串的模型输入canonical_solution:prompt中问题的解决方案description: 任务描述test: 包含用于测试生成的代码正确性的函数entry_point: 测试的入口点language: 调用适当子进程调用以执行程序的编程语言标识符
数据分割
- HumanXEval: Python, Java, JavaScript, Csharp, CPP, Go, Kotlin, PHP, Perl, Ruby, Swift, Scala
- MBXP: Python, Java, JavaScript, TypeScript, Csharp, CPP, Go, Kotlin, PHP, Perl, Ruby, Swift, Scala
- MathQA: Python, Java, JavaScript
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



