基于天元系统的强化学习算法代码及测试数据

Name: 基于天元系统的强化学习算法代码及测试数据
Creator: 北京大学
License: 暂无描述

国家基础学科公共科学数据中心2024-03-05 收录

下载链接：

https://www.nbsdc.cn/general/dataDetail?id=6504342bbb16e0792635c4e6&type=1

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集包含7种强化学习算法的代码及测试数据。具体地，以天元（MegEngine）的核心函数为基础，我们实现了7种有代表性的经典强化学习算法，包括深度Q网络（deep Q network，DQN），优势动作评价算法(advantage actor critic，A2C)，策略梯度（policy gradient，PG），深度决定性策略梯度（deep deterministic policy gradient，DDPG），连续（continuous）或离散（discrete）的软性动作评价算法（soft actor-critic，SAC），近端策略优化（proximal policy optimization，PPO）等。数据集主要包含算法代码、模型快照及训练日志。

提供机构：

北京大学

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集提供了基于天元（MegEngine）系统实现的7种经典强化学习算法代码及测试数据，包括深度Q网络、优势动作评价算法、策略梯度等。内容涵盖算法代码、模型快照和训练日志，数据格式多样，如pkl、txt和py文件。

以上内容由遇见数据集搜集并总结生成