SEAC Training Data

arXiv2025-09-30 收录

下载链接：

https://github.com/alpaficia/SEAC_Pytorch_release

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是由使用软弹性演员-评论家（SEAC）算法进行的实验生成的，比较了该算法与原始软演员-评论家（SAC）算法和近端策略优化（PPO）算法的性能。数据集包含了SEAC算法相较于SAC和PPO算法的平均回报、每项任务的时间成本以及能源消耗等指标。训练规模涉及大约90万至120万步，任务是强化学习，用于控制模拟环境中的智能体运动。

5,000+

优质数据集

54 个

任务类型

进入经典数据集