MiniGrid-Empty-6x6v0
收藏Minigrid 数据集概述
数据集简介
- Minigrid 是一个包含离散网格世界环境的库,用于强化学习研究。
- 环境遵循 Gymnasium 标准 API。
- 设计特点:轻量级、快速、易于定制。
环境分类
1. Minigrid 环境
- 原始 Minigrid 库中的环境。
- 特点:
- 三角形代理,离散动作空间。
- 2D 地图,包含墙壁、熔岩、动态障碍等。
- 任务通过
mission字符串描述。 - 支持多种目标导向和分层任务(如拾取箱子、用钥匙开门、迷宫导航等)。
- 可调性:支持通过程序调整大小/复杂度,适用于课程学习或难度微调。
2. BabyAI 环境
- 源自 BabyAI 项目库。
- 特点:
- 基于 Minigrid 环境,增加了合成自然语言指令功能。
- 研究重点:基础语言学习。
- 任务示例:“将红球放在你左边的盒子旁边”。
安装与支持
- 安装命令:
pip install minigrid - 支持 Python 版本:3.7、3.8、3.9、3.10、3.11。
- 支持平台:Linux 和 macOS(Windows 可提交 PR,但不官方支持)。
训练资源
- 示例代码库:rl-starter-files
- 特点:包含使用 RL 算法训练 Minigrid 环境的示例,默认超参数已知可收敛。
引用
Minigrid 引用
bibtex @inproceedings{MinigridMiniworld23, author = {Maxime Chevalier{-}Boisvert and Bolun Dai and Mark Towers and Rodrigo Perez{-}Vicente and Lucas Willems and Salem Lahlou and Suman Pal and Pablo Samuel Castro and Jordan Terry}, title = {Minigrid {&} Miniworld: Modular {&} Customizable Reinforcement Learning Environments for Goal-Oriented Tasks}, booktitle = {Advances in Neural Information Processing Systems 36, New Orleans, LA, USA}, month = {December}, year = {2023}, }
BabyAI 引用
bibtex @article{chevalier2018babyai, title={Babyai: A platform to study the sample efficiency of grounded language learning}, author={Chevalier-Boisvert, Maxime and Bahdanau, Dzmitry and Lahlou, Salem and Willems, Lucas and Saharia, Chitwan and Nguyen, Thien Huu and Bengio, Yoshua}, journal={arXiv preprint arXiv:1810.08272}, year={2018} }
其他资源
- 文档网站:minigrid.farama.org
- Discord 服务器:https://discord.gg/bnJ6kubTg6
- 项目路线图:Project Roadmap




