penfever/rl__24GPU_shapednemotron-code-oracle-filteredr2egym-nl2bash-stack

Name: penfever/rl__24GPU_shaped__nemotron-code-oracle-filtered__r2egym-nl2bash-stack
Creator: penfever
Published: 2026-03-18 22:54:43
License: 暂无描述

Hugging Face2026-03-18 更新2026-03-29 收录

下载链接：

https://hf-mirror.com/datasets/penfever/rl__24GPU_shaped__nemotron-code-oracle-filtered__r2egym-nl2bash-stack

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: conversations list: - name: content dtype: string - name: role dtype: string - name: agent dtype: string - name: model dtype: string - name: model_provider dtype: string - name: date dtype: string - name: task dtype: string - name: episode dtype: string - name: run_id dtype: string - name: trial_name dtype: string - name: result dtype: string - name: instruction dtype: string - name: verifier_output dtype: string splits: - name: train num_bytes: 411520571 num_examples: 8920 download_size: 411520571 dataset_size: 411520571 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征字段： - 对话集（conversations）：列表类型，列表内的每个元素包含两个子字段： - 内容（content）：字符串类型 - 角色（role）：字符串类型 - 智能体（Agent）：字符串类型 - 模型（Model）：字符串类型 - 模型提供商（Model Provider）：字符串类型 - 日期（date）：字符串类型 - 任务（task）：字符串类型 - 会话轮次（episode）：字符串类型 - 运行ID（run_id）：字符串类型 - 试验名称（trial_name）：字符串类型 - 结果（result）：字符串类型 - 指令（instruction）：字符串类型 - 校验器输出（verifier_output）：字符串类型数据集划分： - 训练集（train）：字节数为411520571，样本量为8920 下载总大小：411520571 字节数据集总大小：411520571 字节配置项： - 默认配置（default）：配置了数据文件，对应训练集（train）划分，数据路径为 data/train-*

提供机构：

penfever

5,000+

优质数据集

54 个

任务类型

进入经典数据集