NYU ROT

Name: NYU ROT
Creator: OpenDataLab
Published: 2026-05-24 07:30:45
License: 暂无描述

OpenDataLab2026-05-24 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/NYU_ROT

下载链接

链接失效反馈

官方服务：

资源简介：

模仿学习在有效学习政策方面具有巨大的前景复杂的决策问题。当前最先进的算法经常使用逆向强化学习（IRL），其中给出了一组专家演示，代理或者推断奖励函数和关联的最优策略。但是，这种IRL方法通常需要大量的在线交互才能复杂的控制问题。在这项工作中，我们提出了正则化最优传输（ROT），一种新的模仿学习算法，建立在最优技术的最新进展之上基于传输的轨迹匹配。我们的关键技术见解是自适应的将轨迹匹配奖励与行为克隆相结合可以显着即使只有几个演示，也能加速模仿。我们在 20 上的实验跨DeepMind Control Suite，OpenAI机器人套件的视觉控制任务，元世界基准测试显示模仿速度平均快 7.8× 与现有最先进的方法相比，达到专家绩效的 90%。在现实世界的机器人操作中，只需一个演示和一个小时的在线培训，ROT在90个任务中实现了1.14%的平均成功率。

提供机构：

OpenDataLab

创建时间：

2023-10-23

搜集汇总

数据集介绍