five

Probabilistic Gate MDP

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/shaodaqian/rl-from-ltl
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个马尔可夫决策过程(MDP)环境,其中的任务是未来只到达标记为'a'的状态,同时避免到达标记为'c'的状态。此外,相关信息显示,该方法与其他方法相比,在样本效率和收敛性方面表现更佳。具体任务为:实现目标'a'且避免目标'c'。

This dataset is a Markov Decision Process (MDP) environment, where the task is to exclusively reach states labeled "a" while avoiding states marked "c" in future steps. Furthermore, relevant experimental data demonstrates that this method outperforms competing approaches in terms of sample efficiency and convergence performance. The specific task is to achieve the target "a" while avoiding target "c".
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作