micahr234/play_frozenlake_avg_expert_big
收藏Hugging Face2026-04-02 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/micahr234/play_frozenlake_avg_expert_big
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: env_name
dtype: string
- name: env_idx
dtype: int64
- name: global_step
dtype: int64
- name: episode_step
dtype: int64
- name: action
dtype: int64
- name: reward
dtype: float64
- name: done
dtype: int64
- name: observation_discrete
list: int64
- name: metadata_prob
dtype: float64
- name: metadata_map
dtype: string
- name: metadata_action_star
dtype: int64
splits:
- name: train
num_bytes: 441398000
num_examples: 2000000
- name: eval
num_bytes: 4317000
num_examples: 20000
- name: test
num_bytes: 4318000
num_examples: 20000
download_size: 19130683
dataset_size: 450033000
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: eval
path: data/eval-*
- split: test
path: data/test-*
---
数据集信息:
特征项:
- 环境名称(env_name):字符串类型
- 环境索引(env_idx):64位整数类型
- 全局步数(global_step):64位整数类型
- 回合步数(episode_step):64位整数类型
- 动作(action):64位整数类型
- 奖励(reward):64位浮点数类型
- 结束标记(done):64位整数类型(通常以0/1分别表示回合未终止与已终止)
- 离散观测(observation_discrete):64位整数列表类型
- 元数据概率(metadata_prob):64位浮点数类型
- 元数据地图(metadata_map):字符串类型
- 元数据最优动作(metadata_action_star):64位整数类型
数据划分:
- 训练集(train):占用字节数441398000,样本量2000000
- 评估集(eval):占用字节数4317000,样本量20000
- 测试集(test):占用字节数4318000,样本量20000
整体参数:下载大小19130683字节,数据集总大小450033000字节
配置信息:
- 默认配置(default):数据文件映射关系如下
- 训练集:对应data/train-*路径下的文件
- 评估集:对应data/eval-*路径下的文件
- 测试集:对应data/test-*路径下的文件
提供机构:
micahr234



