five

play-to-policy

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/play_to_policy
下载链接
链接失效反馈
官方服务:
资源简介:
虽然离线数据的大规模序列建模在自然语言生成和图像生成方面取得了令人印象深刻的性能提升,但将这些想法直接转化为机器人技术一直具有挑战性。造成这种情况的一个关键原因是,从非专家人类演示者收集的未经策划的机器人演示数据(即游戏数据)通常是嘈杂的、多样化的和分布多模式的。这使得从此类数据中提取有用的、以任务为中心的行为成为一个困难的生成建模问题。在这项工作中,我们提出了条件行为变压器(C-BeT),这是一种将行为变压器的多模式生成能力与未来条件目标规范相结合的方法。在一系列模拟基准任务中,我们发现 C-BeT 在从游戏数据中学习方面比之前最先进的工作平均提高了 45.7%。此外,我们首次证明,可以在现实世界的机器人上纯粹从游戏数据中学习有用的以任务为中心的行为,而无需任何任务标签或奖励信息。
提供机构:
OpenDataLab
创建时间:
2023-10-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作