克服顺序多任务学习中灾难性遗忘问题的编码基元策略生成学习代码

Name: 克服顺序多任务学习中灾难性遗忘问题的编码基元策略生成学习代码
Creator: 中国科学院脑科学数据中心
Published: 2023-11-15 13:59:57
License: 暂无描述

中国科学院脑科学数据中心2023-11-15 更新2024-03-05 收录

下载链接：

https://www.braindatacenter.cn/datacenter/web/#/dataSet/details?id=1724668539535597570

下载链接

链接失效反馈

官方服务：

资源简介：

持续学习是人类和动物中普遍存在的能力，旨在不断地学习和获取新的知识和技能。然而当前方法在训练新任务后容易偏离在之前任务中学到的权重，导致灾难性的遗忘，尤其是在顺序多任务场景中。为了解决这个问题，在本文中，我们提议通过专注于顺序学习一系列机器人任务来克服灾难性遗忘。特别地，我们开发了一个名为编码原始生成策略学习（E-PGPL）的新颖的分层神经网络框架，以实现两个组件的持续学习。在学习新任务时，要求特征空间接近之前的空间，以便可以保护以前学到的任务。在几个模拟的机器人任务上的广泛实验展示了我们的方法在处理顺序到达的多任务时学习控制策略的有效性，与其他一些持续学习方法相比，尤其是对于具有更多多样性的任务，性能得到了显著的提高。

提供机构：

中国科学院脑科学数据中心

创建时间：

2023-11-15