five

yuruny/agentic-sudoku-Markov_qwen2.5-3B-it-5e-6_9x9_6-6_gt-SFT_ans1-6k-eval_results

收藏
Hugging Face2025-12-13 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/yuruny/agentic-sudoku-Markov_qwen2.5-3B-it-5e-6_9x9_6-6_gt-SFT_ans1-6k-eval_results
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与聊天完成和动作相关的数据,具有诸如action、chat_completions、done、mc_return、model_response、observation和reward等特征。数据集分为一个训练集,包含102,400个样本,总大小约为156.8 MB。

This dataset contains data related to chat completions and actions, with features such as action, chat_completions, done, mc_return, model_response, observation, and reward. The dataset is split into a training set with 102,400 examples and a total size of approximately 156.8 MB.
提供机构:
yuruny
二维码
社区交流群
二维码
科研交流群
商业服务