five

nuprl/CanItEdit

收藏
Hugging Face2024-03-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nuprl/CanItEdit
下载链接
链接失效反馈
官方服务:
资源简介:
CanItEdit是一个用于评估大型语言模型(LLMs)在遵循代码编辑指令方面能力的基准测试。该基准测试包含105个手工制作的Python程序,每个程序都有修改前后的代码块、两种类型的自然语言指令(描述性和懒人式)以及一个隐藏的测试套件。描述性指令模拟用户提供具体规格或另一个模型概述计划的情况,类似于Reflexion提示;而懒人式指令则类似于用户在代码生成中对LLMs的典型查询。
提供机构:
nuprl
原始信息汇总

数据集概述

数据集名称

CanItEdit

数据集目的

评估大型语言模型(LLMs)在指令代码编辑任务上的表现。

数据集内容

  • 包含105个手工制作的Python程序。
  • 每个程序包含编辑前后的代码块。
  • 提供两种类型的自然语言指令:描述性和懒惰型。
  • 包含一个隐藏的测试套件。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作