micahr234/play_ta_frozenlake_avg
收藏Hugging Face2026-04-13 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/micahr234/play_ta_frozenlake_avg
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: env_name
dtype: string
- name: env_idx
dtype: int64
- name: global_step
dtype: int64
- name: episode_step
dtype: int64
- name: action
dtype: int64
- name: reward
dtype: float64
- name: done
dtype: int64
- name: observation_discrete
list: int64
- name: metadata_prob
dtype: float64
- name: metadata_map
dtype: string
- name: metadata_q_star
list: float64
splits:
- name: train
num_bytes: 256548367
num_examples: 2000000
- name: eval
num_bytes: 2551361
num_examples: 20000
- name: test
num_bytes: 2545442
num_examples: 20000
download_size: 86122678
dataset_size: 261645170
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: eval
path: data/eval-*
- split: test
path: data/test-*
---
数据集信息(dataset_info):
特征项:
- 环境名称(env_name):数据类型为字符串
- 环境索引(env_idx):数据类型为int64
- 全局步数(global_step):数据类型为int64
- 回合步数(episode_step):数据类型为int64
- 动作(action):数据类型为int64
- 奖励(reward):数据类型为float64
- 终止标记(done):数据类型为int64
- 离散观测(observation_discrete):数据类型为int64列表
- 元数据概率(metadata_prob):数据类型为float64
- 元数据地图(metadata_map):数据类型为字符串
- 元数据最优动作价值(metadata_q_star):数据类型为float64列表
数据集划分:
- 训练集(train):占用字节数256548367,样本总数2000000
- 验证集(eval):占用字节数2551361,样本总数20000
- 测试集(test):占用字节数2545442,样本总数20000
下载总大小:86122678字节,数据集总大小:261645170字节
配置项:
- 默认配置(default):数据文件路径设置如下:
- 训练集对应data/train-*
- 验证集对应data/eval-*
- 测试集对应data/test-*
提供机构:
micahr234



