基于梯度不变性的多智能体信用分配算法
收藏国家基础学科公共科学数据中心2026-05-02 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69f37cecf175603f06871e86&type=1
下载链接
链接失效反馈官方服务:
资源简介:
基于梯度不变性的多智能体信用分配算法为中国科学技术大学团队自主开发的算法代码数据集,面向协作式多智能体强化学习中异质智能体场景下个体经验重要性难以区分的问题,通过建立偏微分方程求解个体奖励函数,基于梯度不变性约束实现个体奖励分解与公平经验回放,在SMAC、GRF、MAMujoco等标准基准环境上完成实验验证。代码基于Python与PyTorch开发,构建于PyMARL框架之上,遵循MIT开源协议,文件大小约180KB。
提供机构:
中国科学技术大学



