verifiers-for-code/failed_16_eval
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/verifiers-for-code/failed_16_eval
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如任务ID、提示、规范解决方案等,每个特征都有其数据类型。数据集被分为一个测试集,包含67个样本,总大小为670928字节。
The dataset contains multiple features such as task ID, prompt, canonical solution, etc., each with its own data type. The dataset is divided into a test set containing 67 samples, with a total size of 670928 bytes.
提供机构:
verifiers-for-code
原始信息汇总
数据集概述
数据集信息
特征
- task_id: 字符串类型
- prompt: 字符串类型
- canonical_solution: 字符串类型
- aurora_expt_16: 字符串类型
- cleaned-aurora_expt_16: 字符串类型
- failed_tests: 字符串类型
- output: 字符串类型
- sonnet-3.5_eval: 字符串类型
- deepseek_eval: 字符串类型
- gpt-4-1106-preview_eval: 字符串类型
数据分割
- test:
- 字节数: 670928
- 样本数: 67
数据集大小
- 下载大小: 350909 字节
- 数据集大小: 670928 字节
配置
- config_name: default
- data_files:
- split: test
- path: data/test-*
- data_files:



