具备零样本策略生成能力的终身强化学习数据集

Name: 具备零样本策略生成能力的终身强化学习数据集
Creator: 中国科学院脑科学数据中心
Published: 2023-11-14 15:23:15
License: 暂无描述

中国科学院脑科学数据中心2023-11-14 更新2024-03-05 收录

下载链接：

https://www.braindatacenter.cn/datacenter/web/#/dataSet/details?id=1724327113530515458

下载链接

链接失效反馈

官方服务：

资源简介：

本文提出了一种具有零样本策略生成能力的跨域终身强化学习算法（CDLRL-ZPG），以提高策略知识提取方法从学习任务到学习任务域的泛化能力。在实验中，我们评估了CDLRL-ZPG在四个任务域上的性能。我们的结果表明，该算法可以直接产生令人满意的结果，而不需要经过试错学习过程来实现零样本学习。

提供机构：

中国科学院脑科学数据中心

创建时间：

2023-11-14