codasci/search_rl_pre_diffadded
收藏Hugging Face2025-12-04 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/codasci/search_rl_pre_diffadded
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: ideator_model
dtype: string
- name: executor_model
dtype: string
- name: env
dtype: string
- name: epoch
dtype: int64
- name: idea
dtype: string
- name: code_diff
dtype: string
- name: result
struct:
- name: loss
dtype: float64
- name: meta_data
struct:
- name: idea_idx
dtype: int64
- name: thinking
dtype: string
- name: wandb_run_name
dtype: string
splits:
- name: train
num_bytes: 183034743
num_examples: 16640
download_size: 61231119
dataset_size: 183034743
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征:
- 名称:构思模型(ideator_model),数据类型:字符串
- 名称:执行模型(executor_model),数据类型:字符串
- 名称:运行环境(env),数据类型:字符串
- 名称:训练轮次(epoch),数据类型:64位整数类型
- 名称:构思方案(idea),数据类型:字符串
- 名称:代码差异(code_diff),数据类型:字符串
- 名称:结果(result),数据类型:结构体,包含子特征:
- 名称:损失值(loss),数据类型:64位浮点数类型
- 名称:元数据(meta_data),数据类型:结构体,包含子特征:
- 名称:构思索引(idea_idx),数据类型:64位整数类型
- 名称:思考过程(thinking),数据类型:字符串
- 名称:WandB 运行名称(wandb_run_name),数据类型:字符串
数据划分:
- 划分名称:训练集(train),字节大小:183034743,样本数量:16640
下载大小:61231119字节
数据集总大小:183034743字节
配置项:
- 配置名称:默认配置(default),数据文件路径:
- 训练集划分:data/train-*
提供机构:
codasci



