five

智能体任务学习方法及装置数据集

收藏
中国科学院脑科学数据中心2023-11-15 更新2024-03-05 收录
下载链接:
https://www.braindatacenter.cn/datacenter/web/#/dataSet/details?id=1724669759172091905
下载链接
链接失效反馈
官方服务:
资源简介:
在本文中,我们开发了一个策略生成网络,该网络通过将低维任务特征映射到高维策略参数来对任务间关系进行非线性建模,以便更有效地表示共享知识。同时,我们提出了一种新的终身强化学习目标函数,通过增加误差的权重约束来缓解计算误差的不足。我们实证证明,我们的方法改善了各种动态系统中的零样本策略性能。
提供机构:
中国科学院脑科学数据中心
创建时间:
2023-11-15
二维码
社区交流群
二维码
科研交流群
商业服务