Code-Refinement/utf_20_refs_file_sample100
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Code-Refinement/utf_20_refs_file_sample100
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: problem_id
dtype: int64
- name: question
dtype: string
- name: solutions
dtype: string
- name: input_output
struct:
- name: inputs
sequence: string
- name: outputs
sequence: string
- name: difficulty
dtype: string
- name: url
dtype: string
- name: starter_code
dtype: string
- name: is_call_based
dtype: bool
- name: code_initial
dtype: string
- name: feedback_initial
dtype: string
- name: r_initial
dtype: float64
- name: sol_idx
dtype: int64
- name: chosen_ref_id
dtype: int64
- name: chosen_refinement
dtype: string
- name: chosen_reward
dtype: float64
- name: rejected_ref_id
dtype: int64
- name: rejected_refinement
dtype: string
- name: rejected_reward
dtype: float64
- name: branch_weight
dtype: float64
splits:
- name: train
num_bytes: 3872897
num_examples: 100
- name: test
num_bytes: 935660
num_examples: 100
download_size: 679929
dataset_size: 4808557
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
提供机构:
Code-Refinement
原始信息汇总
数据集概述
数据集特征
- problem_id: 问题ID,数据类型为int64。
- question: 问题描述,数据类型为string。
- solutions: 解决方案,数据类型为string。
- input_output: 输入输出结构,包含以下子字段:
- inputs: 输入序列,数据类型为string。
- outputs: 输出序列,数据类型为string。
- difficulty: 难度级别,数据类型为string。
- url: 相关链接,数据类型为string。
- starter_code: 初始代码,数据类型为string。
- is_call_based: 是否基于调用,数据类型为bool。
- code_initial: 初始代码,数据类型为string。
- feedback_initial: 初始反馈,数据类型为string。
- r_initial: 初始奖励,数据类型为float64。
- sol_idx: 解决方案索引,数据类型为int64。
- chosen_ref_id: 选定的改进ID,数据类型为int64。
- chosen_refinement: 选定的改进,数据类型为string。
- chosen_reward: 选定的奖励,数据类型为float64。
- rejected_ref_id: 被拒绝的改进ID,数据类型为int64。
- rejected_refinement: 被拒绝的改进,数据类型为string。
- rejected_reward: 被拒绝的奖励,数据类型为float64。
- branch_weight: 分支权重,数据类型为float64。
数据集分割
- train: 训练集,包含3872897字节,100个样本。
- test: 测试集,包含935660字节,100个样本。
数据集大小
- download_size: 下载大小为679929字节。
- dataset_size: 数据集大小为4808557字节。
配置
- default: 默认配置,包含以下数据文件:
- train: 路径为
data/train-*。 - test: 路径为
data/test-*。
- train: 路径为



