five

yuruny/agentic-sudoku-NoStateTrans_qwen2.5-3B-it-5e-6_9x9_6-6_gt-SFT_ans1-15k-eval_results

收藏
Hugging Face2025-12-15 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/yuruny/agentic-sudoku-NoStateTrans_qwen2.5-3B-it-5e-6_9x9_6-6_gt-SFT_ans1-15k-eval_results
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个步骤,每个步骤包括动作、聊天完成情况、完成状态、mc_return、模型响应、观察和奖励等子特征。此外,还有一个顶层的奖励特征。数据集包含一个名为train的分割,具有特定的字节大小和示例数量。

The dataset contains multiple steps, each with sub-features such as action, chat completions, done status, mc_return, model response, observation, and reward. Additionally, there is a top-level reward feature. The dataset includes a single split named train with specific byte size and number of examples.
提供机构:
yuruny
二维码
社区交流群
二维码
科研交流群
商业服务