five

NYU ROT

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/NYU_ROT
下载链接
链接失效反馈
官方服务:
资源简介:
模仿学习在有效学习政策方面具有巨大的前景 复杂的决策问题。当前最先进的算法经常使用 逆向强化学习(IRL),其中给出了一组专家演示, 代理或者推断奖励函数和关联的最优策略。 但是,这种IRL方法通常需要大量的在线交互才能 复杂的控制问题。在这项工作中,我们提出了正则化最优传输 (ROT),一种新的模仿学习算法,建立在最优技术的最新进展之上 基于传输的轨迹匹配。我们的关键技术见解是自适应的 将轨迹匹配奖励与行为克隆相结合可以显着 即使只有几个演示,也能加速模仿。我们在 20 上的实验 跨DeepMind Control Suite,OpenAI机器人套件的视觉控制任务, 元世界基准测试显示模仿速度平均快 7.8× 与现有最先进的方法相比,达到专家绩效的 90%。 在现实世界的机器人操作中,只需一个演示和一个小时的 在线培训,ROT在90个任务中实现了1.14%的平均成功率。
提供机构:
OpenDataLab
创建时间:
2023-10-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
NYU ROT数据集聚焦于机器人学习中的模仿学习,提出正则化最优传输(ROT)算法,通过自适应结合轨迹匹配奖励与行为克隆,显著加速模仿过程。该算法在多个控制任务和现实机器人操作中表现高效,例如仅需单个演示和一小时在线培训即可实现高成功率。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作