合作与非合作博弈问题统一求解框架
收藏国家基础学科公共科学数据中心2026-05-02 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69f37cf0f175603f06871e8e&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本数据集为多智能体博弈问题中合作与非合作博弈问题统一求解框架的原始代码实现。针对多智能体博弈问题中合作决策、对抗决策及环境不确定性难以统一建模与求解的问题,本数据集结合混合整数线性规划(MILP)与强化学习(RL)方法,对多智能体博弈结构进行统一表示与求解建模。在合作博弈场景中,通过G2MILP模块将多决策变量及其约束关系建模为图结构,实现多智能体协同优化与实例生成;在非合作博弈场景中,依托RL-SCPO模块引入环境扰动与状态保守约束,刻画智能体与环境之间的对抗博弈过程;同时结合Apollo-MILP交替预测—校正机制,实现模型在博弈反馈驱动下的自我学习与演化。数据集以Python语言实现,基于PyTorch与传统求解器(如SCIP/Gurobi)开发,包含图表示学习、强化学习策略优化、神经预测与校正求解等核心模块及配置脚本。代码遵循MIT开源协议与模块化设计原则,保障了算法的可移植性与可复现性。本数据集不包含固定静态实例文件,相关博弈问题实例与策略交互数据均通过程序运行动态生成,可为博弈智能建模理论与统一求解研究提供完整可复现的算法平台支撑。
提供机构:
中国科学技术大学



