TeachMyAgent
收藏TeachMyAgent 数据集概述
TeachMyAgent 是一个用于自动课程学习方法的测试平台。该平台利用 Box2D 程序生成的环境来评估教师算法在连续任务空间中的性能。
数据集内容
- 两个参数化的 Box2D 环境:Stumps Tracks 和 Parkour
- 多种体现形式:具有不同运动技能的实体(例如,双足步行者、蜘蛛、攀爬的黑猩猩、鱼)
- 两个深度强化学习学生:SAC 和 PPO
- 多个 ACL 算法:ADR、ALP-GMM、Covar-GMM、SPDL、GoalGAN、Setter-Solver、RIAC
- 两个基准实验:特定技能比较和全局性能评估
- 三个用于系统分析的笔记本:使用统计测试和可视化工具(图表、视频等)进行结果分析,允许重现我们的图表
安装指南
-
获取仓库 bash git clone https://github.com/flowersteam/TeachMyAgent cd TeachMyAgent/
-
使用 Conda 安装(使用 Python >= 3.6) bash conda create --name teachMyAgent python=3.6 conda activate teachMyAgent pip install -e .
注意:对于 Windows 用户,在
pip install -e .命令中添加-f https://download.pytorch.org/whl/torch_stable.html。
导入基准结果
为了将方法与我们在论文中评估的方法进行基准测试,必须下载我们的结果:
-
进入
notebooks文件夹 -
使
download_baselines.sh脚本可执行: bash chmod +x download_baselines.sh -
下载结果: bash ./download_baselines.sh
警告:这将下载一个大约 4.5GB 的 zip 文件。然后,我们的脚本将在
TeachMyAgent/data中提取 zip 文件。提取后,结果将大约占用 15GB。
使用方法
有关如何使用我们的平台来基准测试 ACL 方法的详细信息,请参阅我们的文档。
引用
如果您在工作中使用 TeachMyAgent,请引用配套的论文:
bibtex @inproceedings{romac2021teachmyagent, author = {Cl{{e}}ment Romac and R{{e}}my Portelas and Katja Hofmann and Pierre{-}Yves Oudeyer}, title = {TeachMyAgent: a Benchmark for Automatic Curriculum Learning in Deep {RL}}, booktitle = {Proceedings of the 38th International Conference on Machine Learning, {ICML} 2021, 18-24 July 2021, Virtual Event}, series = {Proceedings of Machine Learning Research}, volume = {139}, pages = {9052--9063}, publisher = {{PMLR}}, year = {2021} }



