five

具备零样本策略生成能力的终身强化学习数据集

收藏
中国科学院脑科学数据中心2023-11-14 更新2024-03-05 收录
下载链接:
https://www.braindatacenter.cn/datacenter/web/#/dataSet/details?id=1724327113530515458
下载链接
链接失效反馈
官方服务:
资源简介:
本文提出了一种具有零样本策略生成能力的跨域终身强化学习算法(CDLRL-ZPG),以提高策略知识提取方法从学习任务到学习任务域的泛化能力。在实验中,我们评估了CDLRL-ZPG在四个任务域上的性能。我们的结果表明,该算法可以直接产生令人满意的结果,而不需要经过试错学习过程来实现零样本学习。
提供机构:
中国科学院脑科学数据中心
创建时间:
2023-11-14
二维码
社区交流群
二维码
科研交流群
商业服务