Locomotion and Manipulation Environments
收藏arXiv2025-09-30 收录
下载链接:
https://mazpie.github.io/genrl/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了4个运动环境(Walker、Cheetah、Quadruped和Stickman)以及1个操作环境(厨房),用于在没有奖励的情况下训练智能体,共涉及35项任务,这些任务通过文本提示来指导。数据集混合了结构化数据(重放缓冲区)和非结构化数据(探索数据),并将明确的奖励信息替换为简短的任务描述。这是一项大规模研究,旨在探究强化学习中使用视觉和语言提示进行多任务泛化的问题。



