NathanGavenski/LunarLander-v2

Name: NathanGavenski/LunarLander-v2
Creator: NathanGavenski
Published: 2024-06-11 13:50:34
License: 暂无描述

Hugging Face2024-06-11 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/NathanGavenski/LunarLander-v2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由Imitation Learning Datasets项目创建，使用了来自HuggingFace的PPO策略的Stable Baselines权重。数据集包含1,000个episode，每个episode的平均奖励为500。每个条目包含：观察值（长度为8的列表）、动作（0、1、2和3）、奖励（该时间步的奖励点）和是否为episode初始时间步的布尔值。

提供机构：

NathanGavenski

原始信息汇总

数据集概述

创建项目：Imitation Learning Datasets
创建方法：使用Stable Baselines的PPO政策权重，来源自HuggingFace。

5,000+

优质数据集

54 个

任务类型

进入经典数据集