verifiers-for-code/failed_16_eval

Name: verifiers-for-code/failed_16_eval
Creator: verifiers-for-code
Published: 2024-07-17 03:25:26
License: 暂无描述

Hugging Face2024-07-17 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/verifiers-for-code/failed_16_eval

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征，如任务ID、提示、规范解决方案等，每个特征都有其数据类型。数据集被分为一个测试集，包含67个样本，总大小为670928字节。

The dataset contains multiple features such as task ID, prompt, canonical solution, etc., each with its own data type. The dataset is divided into a test set containing 67 samples, with a total size of 670928 bytes.

提供机构：

verifiers-for-code

原始信息汇总

数据集概述

数据集信息

特征

task_id: 字符串类型
prompt: 字符串类型
canonical_solution: 字符串类型
aurora_expt_16: 字符串类型
cleaned-aurora_expt_16: 字符串类型
failed_tests: 字符串类型
output: 字符串类型
sonnet-3.5_eval: 字符串类型
deepseek_eval: 字符串类型
gpt-4-1106-preview_eval: 字符串类型

数据分割

test:
- 字节数: 670928
- 样本数: 67

数据集大小

下载大小: 350909 字节
数据集大小: 670928 字节

配置

config_name: default
- data_files:
  - split: test
  - path: data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集