five

SMACv2

收藏
arXiv2023-10-17 更新2024-06-21 收录
下载链接:
https://github.com/oxwhirl/smacv2
下载链接
链接失效反馈
官方服务:
资源简介:
SMACv2是由牛津大学开发的一个改进的协作多智能体强化学习基准数据集。该数据集包含14个微观管理场景,通过程序内容生成(PCG)技术,确保了场景的随机性和部分观测性,从而要求智能体使用闭环策略。SMACv2旨在解决原始SMAC数据集的局限性,如缺乏随机性和有意义的部分观测性。数据集的应用领域主要集中在多智能体强化学习算法的测试和评估,特别是在需要复杂协作策略的场景中。

SMACv2 is an improved collaborative multi-agent reinforcement learning benchmark dataset developed by the University of Oxford. This dataset includes 14 micromanagement scenarios, which utilize procedural content generation (PCG) technology to ensure scenario randomness and partial observability, thus requiring agents to adopt closed-loop policies. SMACv2 is designed to address the limitations of the original SMAC dataset, such as the lack of randomness and meaningful partial observability. The primary application domains of this dataset focus on the testing and evaluation of multi-agent reinforcement learning algorithms, especially in scenarios that require complex collaborative strategies.
提供机构:
牛津大学
创建时间:
2022-12-15
搜集汇总
数据集介绍
main_image_url
构建方式
SMACv2 数据集构建方式的描述
特点
数据集特点描述
使用方法
数据集使用方法描述
背景与挑战
背景概述
SMACv2 数据集由牛津大学、伦敦大学学院、Meta AI 和曼彻斯特大学的研究人员于 2023 年 10 月 17 日创建。该数据集旨在解决合作多智能体强化学习(MARL)中的集中式训练和分布式执行(CTDE)范式中的挑战。原始的 StarCraft 多智能体挑战(SMAC)数据集在促进该领域的研究方面发挥了重要作用,但随着算法性能的不断提高,SMAC 的局限性逐渐显现,例如缺乏随机性和有意义的部分可观测性。SMACv2 通过引入程序化内容生成(PCG)技术,随机生成团队组成和智能体起始位置,从而提高了随机性,并要求智能体在评估时泛化到之前未见过的设置。此外,SMACv2 还引入了扩展的部分可观测性挑战(EPO),通过限制部分智能体对敌人的观测,确保了有意义的部分可观测性。SMACv2 的创建为下一代 MARL 方法的评估和改进提供了新的基准。
当前挑战
SMACv2 数据集面临着一些挑战,包括: 1) 随机性和部分可观测性:SMACv2 通过随机生成团队组成和智能体起始位置来提高随机性,但这同时也增加了智能体在评估时泛化到之前未见过的设置的难度。此外,EPO 挑战通过限制部分智能体对敌人的观测,进一步增加了任务的难度。 2) 单位多样性:SMACv2 引入了不同类型的单位,这要求智能体能够适应不同的作战环境和策略。 3) 部分可观测性:EPO 挑战要求智能体在没有完整观测的情况下进行决策,这需要智能体具备有效的信息交流和目标优先级划分能力。 4) 单位视野和攻击范围:SMACv2 使用了游戏中真实的单位视野和攻击范围,这要求智能体能够根据单位特性进行有效的作战策略制定。
常用场景
经典使用场景
SMACv2 数据集作为合作多智能体强化学习(MARL)领域的基准测试平台,其经典使用场景包括评估和比较不同 MARL 算法的性能和泛化能力。SMACv2 通过其程序化内容生成(PCG)机制和扩展的观测挑战(EPO),为算法提供了更具随机性和部分可观测性的环境,从而要求算法能够适应多样化的场景并解决更复杂的协调问题。SMACv2 还可用于研究部分可观测性和随机性对 MARL 算法的影响,以及开发能够有效解决这些挑战的新算法。
实际应用
SMACv2 数据集的实际应用场景包括但不限于:1. 开发和测试用于多智能体系统的协同算法,例如自动驾驶、机器人协作、多人游戏等。2. 研究部分可观测性和随机性对多智能体系统的影响,以及如何设计算法来克服这些挑战。3. 评估和比较不同 MARL 算法的性能和泛化能力,从而选择最适合特定应用的算法。4. 探索和开发新的 MARL 算法,以解决更复杂的协同问题,并提高算法的鲁棒性和泛化能力。
衍生相关工作
SMACv2 数据集的提出促进了 MARL 领域的研究和发展,并衍生了许多相关的经典工作。这些工作包括:1. 开发新的 MARL 算法,以解决 SMACv2 中的随机性和部分可观测性挑战,例如基于序列模型的算法和基于注意力机制的算法。2. 研究部分可观测性和随机性对 MARL 算法的影响,并探索如何设计算法来克服这些挑战。3. 开发新的基准测试平台,以评估和比较不同 MARL 算法的性能和泛化能力,例如基于其他游戏的平台或基于真实世界的平台。4. 将 SMACv2 的研究成果应用于实际应用场景,例如自动驾驶、机器人协作、多人游戏等。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作