five

Tensor and Matrix Low-Rank Value-Function Approximation in Reinforcement Learning

收藏
DataCite Commons2026-01-07 更新2025-04-16 收录
下载链接:
https://service.tib.eu/ldmservice/dataset/a3f2f28a-6d7c-40c5-8872-8b5b7eec7c7e
下载链接
链接失效反馈
官方服务:
资源简介:
Value-function (VF) approximation is a central problem in Reinforcement Learning (RL). Classical non-parametric VF estimation suffers from the curse of dimensionality. As a result, parsimonious parametric models have been adopted to approximate VFs in high-dimensional spaces, with most efforts being focused on linear and neural-network-based approaches.

价值函数(Value-function, VF)近似是强化学习(Reinforcement Learning, RL)中的核心问题。经典非参数VF估计存在维数灾难问题。为此,学界已采用简约参数化模型在高维空间中近似价值函数,目前绝大多数相关研究聚焦于线性方法与基于神经网络的方法。
提供机构:
TIB
创建时间:
2024-12-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作