five

metaworld_mt50

收藏
Hugging Face2025-03-01 更新2025-04-08 收录
下载链接:
https://huggingface.co/datasets/lerobot/metaworld_mt50
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自Meta-world模拟基准的每个任务的50个演示,这些演示是使用专家策略生成的。Meta-world的相关信息可以在https://arxiv.org/abs/1910.10897找到。我们对相机进行了重新定位,并翻转了渲染的图像,具体如下:env.model.cam_pos[2] = [0.75, 0.075, 0.7]。数据集的结构包括多个特征,如观察状态、动作、奖励、成功标志、环境状态、图像等,具体细节可以在meta/info.json中找到。

This dataset contains 50 demonstrations for each task from the Meta-world simulation benchmark, which are generated using expert policies. Relevant information about Meta-world can be found at https://arxiv.org/abs/1910.10897. We repositioned the camera and flipped the rendered images, with the specific configuration as follows: env.model.cam_pos[2] = [0.75, 0.075, 0.7]. The structure of the dataset includes multiple features such as observation states, actions, rewards, success flags, environment states, images, etc. Specific details can be found in meta/info.json.
提供机构:
lerobot
创建时间:
2025-02-19
原始信息汇总

数据集概述

基本信息

  • 名称: metaworld_mt50
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 代码库版本: v2.0
  • 机器人类型: metaworld

数据集描述

  • 来源: 使用LeRobot创建,基于Meta-world仿真基准。
  • 内容: 每个任务包含50个演示,由专家策略生成。
  • 图像处理: 重新定位相机并翻转渲染图像。
  • 参考论文: Meta-world

数据集结构

  • 总任务数: 49
  • 总帧数: 204806
  • 总视频数: 0
  • 总块数: 3
  • 块大小: 1000
  • 帧率: 80 fps
  • 训练集: 0:2500

数据特征

  • observation.state: 浮点型,形状[4]
  • action: 浮点型,形状[4],包含x, y, z, gripper
  • next.reward: 浮点型,形状[1]
  • next.success: 布尔型,形状[1]
  • observation.environment_state: 浮点型,形状[39],包含keypoints
  • observation.image: 图像类型,形状[3, 480, 480],包含channels, height, width
  • task_id: 整型,形状[1]
  • timestamp: 浮点型,形状[1]
  • frame_index: 整型,形状[1]
  • episode_index: 整型,形状[1]
  • index: 整型,形状[1]
  • task_index: 整型,形状[1]

引用信息

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,大规模仿真数据的构建对于算法泛化能力至关重要。metaworld_mt50数据集依托LeRobot平台,通过高保真物理仿真环境生成,涵盖了49种不同的机器人操作任务。数据采集过程以80帧每秒的频率记录,包含2500个完整交互片段,总计超过20万帧数据。每个片段均以Parquet格式存储,并辅以同步的视频记录,确保了数据的一致性与可追溯性。
特点
该数据集的核心特征在于其多任务架构与丰富的模态信息。数据集囊括了机器人状态观测、关节动作、环境关键点、480x480像素的RGB图像以及任务完成标志等多种信号,形成了高维度的时空序列。数据以统一的时间戳和帧索引进行对齐,支持跨任务的分析与建模。其结构化的特征定义与分块存储设计,为高效的数据加载与分布式处理提供了便利。
使用方法
研究人员可通过HuggingFace数据集库直接加载metaworld_mt50,利用其预定义的数据分割进行模型训练与评估。数据集支持按任务索引筛选特定操作场景,或依据帧序列构建时序预测模型。典型的应用流程包括从观测图像中提取视觉特征,结合环境状态与动作序列,训练端到端的机器人策略网络。其附带的成功标志与奖励信号可直接用于强化学习算法的监督信号生成。
背景与挑战
背景概述
在机器人学习领域,多任务强化学习一直是推动智能体泛化能力的关键研究方向。MetaWorld-MT50数据集作为这一领域的重要资源,由LeRobot团队基于开源平台构建,旨在为机器人操作任务提供大规模、多样化的仿真数据。该数据集涵盖了49种不同的机械臂操作任务,包含超过20万帧的状态-动作对记录,其核心研究问题聚焦于如何通过统一的数据框架支持跨任务策略学习与迁移,从而降低真实机器人训练的成本与风险,对推动机器人从单一技能向通用操作能力演进具有显著影响力。
当前挑战
MetaWorld-MT50数据集致力于解决机器人多任务操作中的泛化性挑战,即如何使单一智能体在未见过的任务中快速适应并执行精确操作。构建过程中,数据采集面临仿真环境与真实世界的语义对齐难题,需确保状态表示(如关节角度、图像观测)在不同任务间保持一致性;同时,高维动作空间与长时程决策要求数据具备丰富的探索覆盖,以避免策略过拟合。此外,数据集的规模与多样性平衡、任务间动力学差异的平滑建模,均为算法设计带来了持续的复杂性。
常用场景
经典使用场景
在机器人学习领域,元强化学习旨在训练智能体快速适应新任务,而metaworld_mt50数据集为此提供了理想平台。该数据集包含49种不同的机器人操作任务,涵盖抓取、推拉、开门等多种场景,每个任务均配有高维状态观测、动作序列及成功标签。研究者可利用其丰富的多任务环境,评估算法在跨任务泛化与快速技能迁移方面的性能,尤其适用于元学习与多任务强化学习模型的训练与验证。
衍生相关工作
围绕metaworld_mt50数据集,学术界涌现了一系列经典研究工作。例如,基于该环境的多任务元强化学习算法如PEARL、MAML的变体被广泛探索,以提升跨任务策略的泛化能力。同时,该数据集也催生了关于视觉-动作表征学习、分层技能提取以及离线元学习等方向的研究,为机器人学习社区提供了重要的基准测试与创新灵感。
数据集最近研究
最新研究方向
在机器人学习领域,metaworld_mt50数据集以其涵盖49项任务的丰富多样性,为多任务强化学习研究提供了关键支撑。当前前沿探索聚焦于跨任务知识迁移与泛化能力的提升,研究者们正利用该数据集的高维状态观测与动作序列,开发能够高效适应新环境的元学习算法。随着具身智能与通用机器人技术的兴起,该数据集在推动策略共享、样本效率优化以及视觉-运动协同控制等热点方向上扮演着核心角色,其大规模仿真数据为降低真实世界训练成本、加速智能体泛化性能验证带来了深远影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作