Grid-Worlds
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/ejcatt/aixijs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了在10×10和20×20的网格世界环境中进行的实验,旨在比较探究增强学习器(Inq)与其他弱渐进最优智能体的性能。这些实验平均基于50次模拟,采用折扣因子γ=0.99,每次模拟使用600个蒙特卡洛树搜索样本,并且规划视野设定为6步。实验的规模分别为10×10和20×20的网格,任务是对强化学习算法进行比较研究。



