new_embodiment_v2

Hugging Face2025-07-19 更新2025-07-20 收录

下载链接：

https://huggingface.co/datasets/abhifoo/new_embodiment_v2

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个与LeRobot项目相关的数据集，包含1个剧集，750帧图像，1个任务，2个视频和1个数据块。数据集采用apache-2.0许可。数据集中的特征包括动作、观察状态、正面图像、手腕图像等，每个特征都有详细的类型和形状信息。

创建时间：

2025-07-19

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: robotics
标签: LeRobot
配置:
- 默认配置数据文件路径: data/*/*.parquet

数据集描述

创建工具: LeRobot
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

代码库版本: v2.1
机器人类型: lekiwi_client
总集数: 1
总帧数: 750
总任务数: 1
总视频数: 2
总块数: 1
块大小: 1000
帧率: 30 fps
数据分割:
- 训练集: 0:1
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征信息

动作 (action):
- 数据类型: float32
- 形状: [9]
- 名称:
  - arm_shoulder_pan.pos
  - arm_shoulder_lift.pos
  - arm_elbow_flex.pos
  - arm_wrist_flex.pos
  - arm_wrist_roll.pos
  - arm_gripper.pos
  - x.vel
  - y.vel
  - theta.vel
观测状态 (observation.state):
- 数据类型: float32
- 形状: [9]
- 名称: 同动作特征
观测图像 (observation.images.front):
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
  - 高度: 480
  - 宽度: 640
  - 编码: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 帧率: 30
  - 通道数: 3
  - 是否有音频: false
观测图像 (observation.images.wrist):
- 数据类型: video
- 形状: [640, 480, 3]
- 名称: height, width, channels
- 视频信息:
  - 高度: 640
  - 宽度: 480
  - 编码: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 帧率: 30
  - 通道数: 3
  - 是否有音频: false
时间戳 (timestamp):
- 数据类型: float32
- 形状: [1]
帧索引 (frame_index):
- 数据类型: int64
- 形状: [1]
集索引 (episode_index):
- 数据类型: int64
- 形状: [1]
索引 (index):
- 数据类型: int64
- 形状: [1]
任务索引 (task_index):
- 数据类型: int64
- 形状: [1]

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，new_embodiment_v2数据集通过LeRobot框架系统化采集，采用高精度传感器记录机械臂的关节位置与速度数据，同时整合前视与腕部摄像头的视频流。数据以30帧每秒的速率同步捕获，存储为结构化的Parquet格式，确保时序一致性与多模态对齐，每个数据块包含完整的操作序列，支撑机器人动作学习的建模需求。

使用方法

研究者可通过加载Parquet文件直接访问多模态数据流，其中动作与状态字段以浮点数组形式呈现，视频数据可通过路径索引解码。数据集默认划分为训练集，支持端到端策略学习或离线强化学习任务。使用前需配置LeRobot环境，依据帧索引与时间戳实现数据同步，适用于仿真训练或真实机器人控制验证。

背景与挑战

背景概述

机器人学习领域近年来在具身智能方向取得显著进展，new_embodiment_v2数据集作为LeRobot项目的重要组成部分，专注于多模态机器人控制数据的采集与处理。该数据集通过集成机械臂关节位置、末端执行器速度及双视角视觉观测，构建了面向复杂操作任务的强化学习环境。其采用Apache 2.0开源协议，以标准化数据格式支持机器人行为克隆与策略学习研究，为具身智能系统在真实场景中的适应性提供关键数据支撑。

当前挑战

该数据集需解决高维连续动作空间与多模态感知的协同建模难题，包括视觉-运动链路的时空对齐、异构传感器数据的跨模态融合等核心技术瓶颈。在构建过程中面临机械系统标定误差补偿、多视角视频同步采集、大规模运动数据存储优化等工程挑战，同时需确保动作指令与视觉观测间的时间一致性，这对数据采集系统的精确性与稳定性提出极高要求。

常用场景

经典使用场景

在机器人学习领域，new_embodiment_v2数据集为模仿学习与强化学习算法提供了多模态训练范本。其经典应用场景包括机械臂动作轨迹生成与视觉运动协调任务，通过整合前视角与腕部视角的双目视觉输入，结合九维关节位置与速度控制信号，为机器人操作技能的学习建立了完整的感知-动作映射体系。

解决学术问题

该数据集有效解决了机器人操作任务中高维状态-动作空间建模的学术难题，通过提供精确的时间同步多模态数据，支持端到端策略学习研究。其意义在于建立了真实物理环境与算法训练的桥梁，为机器人运动控制、多传感器融合及跨模态表示学习提供了标准化评估基准，推动了具身智能领域的实证研究进展。

实际应用

实际应用中，该数据集可支撑工业自动化场景的机械臂分拣、精密装配等任务算法开发。通过提供真实机械臂（lekiwi_client）的操作数据，能够有效降低实体机器人训练成本，加速服务机器人、医疗机器人等领域的技能迁移应用，为机器人自适应环境交互提供数据驱动解决方案。

数据集最近研究