Policy Optimization for Low-rank MDPs (POLO)

DataCite Commons2024-12-17 更新2025-04-16 收录

下载链接：

https://service.tib.eu/ldmservice/dataset/5063044e-c020-4f5c-9326-43e490f092c3

下载链接

链接失效反馈

官方服务：

资源简介：

Learning Adversarial Low-rank Markov Decision Processes with Unknown Transition and Full-information Feedback

提供机构：

TIB

创建时间：

2024-12-17

5,000+

优质数据集

54 个

任务类型

进入经典数据集

社区交流群

面向社区/商业的数据集话题

科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作