MOMALAND
收藏MOMAland 数据集概述
简介
MOMAland 是一个开源的 Python 库,用于开发和比较多目标多智能体强化学习算法。它提供了一个标准的 API 来实现学习算法和环境之间的通信,以及一组符合该 API 标准的环境。这些环境遵循 PettingZoo APIs,但返回的是向量化奖励(numpy 数组)而不是标量值。
环境
MOMAland 包含来自多目标多智能体强化学习文献中的环境,以及多目标版本的经典环境,如 SISL 或 Butterfly。完整的环境列表可在 这里 找到。
安装
安装 MOMAland 的命令如下: bash pip install momaland
此外,还可以安装特定功能的依赖项:
pip install "momaland[testing]"用于 API 测试的依赖项。pip install "momaland[learning]"用于提供的学习算法的依赖项。pip install "momaland[all]"用于所有组件的所有依赖项。
API
MOMAland API 类似于 PettingZoo,将环境建模为简单的 Python env 类。以下是一个使用 "momultiwalker_stability_v0" 环境的示例:
python
from momaland.envs.momultiwalker_stability import momultiwalker_stability_v0 as _env
import numpy as np
env = _env.env(render_mode="human") env.reset(seed=42) for agent in env.agent_iter(): observation, vec_reward, termination, truncation, info = env.last() if termination or truncation: action = None else: action = env.action_space(agent).sample() env.step(action) env.close()
学习算法
MOMAland 提供了一系列兼容其环境的学习算法,这些算法实现于 learning/ 目录中。当前实现的学习算法包括:
- MOMAPPO (OLS) continuous, discrete
- Scalarized IQL
- Centralization wrapper
- Linearization wrapper
环境版本控制
MOMAland 对环境进行严格版本控制,以确保可重复性。所有环境名称后缀为 "_v0"。当环境发生变化可能影响学习结果时,版本号会增加以防止混淆。
引用
如果您的研究中使用了 MOMAland,请引用以下内容: bibtex @misc{felten2024momaland, title={MOMAland: A Set of Benchmarks for Multi-Objective Multi-Agent Reinforcement Learning}, author={Florian Felten and Umut Ucak and Hicham Azmani and Gao Peng and Willem Röpke and Hendrik Baier and Patrick Mannion and Diederik M. Roijers and Jordan K. Terry and El-Ghazali Talbi and Grégoire Danoy and Ann Nowé and Roxana Rădulescu}, year={2024}, eprint={2407.16312}, archivePrefix={arXiv}, primaryClass={cs.MA}, url={https://arxiv.org/abs/2407.16312}, }

- 1MOMAland: A Set of Benchmarks for Multi-Objective Multi-Agent Reinforcement Learning卢森堡大学 · 2024年



