yuruny/Qwen2.5-7B-Instruct-non_markovian_0-eval_results

Name: yuruny/Qwen2.5-7B-Instruct-non_markovian_0-eval_results
Creator: yuruny
Published: 2025-11-17 16:19:18
License: 暂无描述

Hugging Face2025-11-17 更新2025-12-20 收录

下载链接：

https://hf-mirror.com/datasets/yuruny/Qwen2.5-7B-Instruct-non_markovian_0-eval_results

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: steps list: - name: action dtype: string - name: chat_completions list: - name: content dtype: string - name: role dtype: string - name: done dtype: bool - name: mc_return dtype: float64 - name: model_response dtype: string - name: observation dtype: string - name: reward dtype: float64 - name: reward dtype: float64 splits: - name: train num_bytes: 302622098 num_examples: 102400 download_size: 38522513 dataset_size: 302622098 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征字段： - 名称：steps（步骤），为列表类型，其元素包含以下子字段： - 名称：action（动作），数据类型为字符串 - 名称：chat_completions（对话补全），为列表类型，其元素包含以下子字段： - 名称：content（内容），数据类型为字符串 - 名称：role（角色），数据类型为字符串 - 名称：done（完成标记），数据类型为布尔值 - 名称：mc_return（蒙特卡洛回报，Monte Carlo Return），数据类型为64位浮点数 - 名称：model_response（模型响应），数据类型为字符串 - 名称：observation（观测结果），数据类型为字符串 - 名称：reward（奖励），数据类型为64位浮点数 - 名称：reward（全局奖励），数据类型为64位浮点数数据划分： - 名称：train（训练集），字节大小：302622098，样本数量：102400 下载大小：38522513字节数据集总大小：302622098字节配置项： - 配置名称：default（默认配置），数据文件配置： - 数据划分：train（训练集），文件路径：data/train-*

提供机构：

yuruny

5,000+

优质数据集

54 个

任务类型

进入经典数据集