five

基于天元系统的强化学习算法代码及测试数据

收藏
国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=6504342bbb16e0792635c4e6&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集包含7种强化学习算法的代码及测试数据。具体地,以天元(MegEngine)的核心函数为基础,我们实现了7种有代表性的经典强化学习算法,包括深度Q网络(deep Q network,DQN),优势动作评价算法(advantage actor critic,A2C),策略梯度(policy gradient,PG),深度决定性策略梯度(deep deterministic policy gradient,DDPG),连续(continuous)或离散(discrete)的软性动作评价算法(soft actor-critic,SAC),近端策略优化(proximal policy optimization,PPO)等。数据集主要包含算法代码、模型快照及训练日志。
提供机构:
北京大学
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集提供了基于天元(MegEngine)系统实现的7种经典强化学习算法代码及测试数据,包括深度Q网络、优势动作评价算法、策略梯度等。内容涵盖算法代码、模型快照和训练日志,数据格式多样,如pkl、txt和py文件。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务