fangchenliu/maskdp_data
收藏数据集概述
数据集名称
Dataset for Masked Autoencoding for Scalable and Generalizable Decision Making
数据集来源
该数据集用于论文《Masked Autoencoding for Scalable and Generalizable Decision Making》。
数据集格式
数据集的组织结构如下:
├── maskdp_train │ ├── cheetah │ │ ├── expert # 来自TD3策略的近专家轨迹 | | | ├── cheetah_run | | | | ├── 0.npy | | | | ├── 1.npy | | | | ├── ... | | | ├── cheetah_run_backwards │ │ ├── sup # 监督数据,完整经验回放与外在奖励 | | | ├── cheetah_run | | | ├── cheetah_run_backwards │ │ ├── semi # 半监督数据,完整经验回放与内在+外在奖励 | | | ├── cheetah_run | | | ├── cheetah_run_backwards │ │ ├── unsup # 无监督数据,完整经验回放与内在奖励 | | | ├── 0.npy | | | ├── 1.npy | | | ├── ... │ ├── walker ... │ ├── quadruped ... ├── maskdp_eval │ ├── expert │ │ ├── cheetah_run │ │ ├── cheetah_run_backwards │ │ ├── ... │ │ ├── walker_stand │ │ ├── quadruped_walk │ │ ├── ... │ ├── unsup │ │ ├── cheetah │ │ ├── walker │ │ ├── quadruped
数据类型
数据集包含以下四种类型:
- 无监督数据(仅使用内在奖励的训练经验)
- 半监督数据(使用内在奖励+外在奖励的训练经验)
- 监督数据(仅使用外在奖励的训练经验)
- 专家数据(来自近专家TD3检查点的轨迹)




