Cooperative Navigation Benchmark Environment
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/xylee95/MD-PGT
下载链接
链接失效反馈官方服务:
资源简介:
该数据集涉及多智能体协作导航任务,在二维网格世界中,智能体们需要各自导航以达到设定的目标。奖励函数定义为智能体与目标之间的欧几里得距离的负值,同时对于碰撞行为设有惩罚。智能体的策略由一个包含三层的密集神经网络来表示。该任务的规模涉及五个智能体,属于多智能体强化学习任务范畴。
提供机构:
Derived from particle environment



