yuruny/agentic-sudoku-Markov_qwen2.5-3B-it-5e-6_9x9_6-6_gt-SFT_ans1-markovian-eval_results

Name: yuruny/agentic-sudoku-Markov_qwen2.5-3B-it-5e-6_9x9_6-6_gt-SFT_ans1-markovian-eval_results
Creator: yuruny
Published: 2025-12-11 14:43:52
License: 暂无描述

Hugging Face2025-12-11 更新2025-12-20 收录

下载链接：

https://hf-mirror.com/datasets/yuruny/agentic-sudoku-Markov_qwen2.5-3B-it-5e-6_9x9_6-6_gt-SFT_ans1-markovian-eval_results

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: steps list: - name: action dtype: string - name: chat_completions list: - name: content dtype: string - name: role dtype: string - name: done dtype: bool - name: mc_return dtype: float64 - name: model_response dtype: string - name: observation dtype: string - name: reward dtype: float64 - name: reward dtype: float64 splits: - name: train num_bytes: 376588 num_examples: 100 download_size: 47268 dataset_size: 376588 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征： - 字段`steps`：列表类型，其列表元素包含以下子属性： - `action`：字符串类型 - `chat_completions`：列表类型，内部子属性包括： - `content`：字符串类型 - `role`：字符串类型 - `done`：布尔类型 - `mc_return`：64位浮点数类型 - `model_response`：字符串类型 - `observation`：字符串类型 - `reward`：64位浮点数类型 - 字段`reward`：64位浮点数类型数据集拆分： - 训练集（train）：占用字节数376588，共包含100个样本下载总大小：47268，数据集存储总大小：376588 数据集配置： - 默认配置（default）：对应训练拆分的数据文件路径为`data/train-*`

提供机构：

yuruny