minesweeper
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/yandex-research/heterophilous-graphs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含五个不同大小的舰船,它们被随机放置在一个10×10的网格中。在这个任务中,智能体必须在不了解舰船实际位置的情况下击沉所有舰船。对于击中舰船的步骤,系统会给予奖励,而对于每一步的时间消耗,则会施加惩罚。该任务的规模是基于10×10的网格,主要任务是处理部分可观测马尔可夫决策过程(Pomdps)中的决策制定。



