new_embodiment_v2
收藏Hugging Face2025-07-19 更新2025-07-20 收录
下载链接:
https://huggingface.co/datasets/abhifoo/new_embodiment_v2
下载链接
链接失效反馈官方服务:
资源简介:
这是一个与LeRobot项目相关的数据集,包含1个剧集,750帧图像,1个任务,2个视频和1个数据块。数据集采用apache-2.0许可。数据集中的特征包括动作、观察状态、正面图像、手腕图像等,每个特征都有详细的类型和形状信息。
创建时间:
2025-07-19
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: robotics
- 标签: LeRobot
- 配置:
- 默认配置数据文件路径:
data/*/*.parquet
- 默认配置数据文件路径:
数据集描述
- 创建工具: LeRobot
- 主页: [More Information Needed]
- 论文: [More Information Needed]
数据集结构
- 代码库版本: v2.1
- 机器人类型: lekiwi_client
- 总集数: 1
- 总帧数: 750
- 总任务数: 1
- 总视频数: 2
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 数据分割:
- 训练集:
0:1
- 训练集:
- 数据路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征信息
- 动作 (action):
- 数据类型: float32
- 形状: [9]
- 名称:
- arm_shoulder_pan.pos
- arm_shoulder_lift.pos
- arm_elbow_flex.pos
- arm_wrist_flex.pos
- arm_wrist_roll.pos
- arm_gripper.pos
- x.vel
- y.vel
- theta.vel
- 观测状态 (observation.state):
- 数据类型: float32
- 形状: [9]
- 名称: 同动作特征
- 观测图像 (observation.images.front):
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
- 高度: 480
- 宽度: 640
- 编码: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 是否有音频: false
- 观测图像 (observation.images.wrist):
- 数据类型: video
- 形状: [640, 480, 3]
- 名称: height, width, channels
- 视频信息:
- 高度: 640
- 宽度: 480
- 编码: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 是否有音频: false
- 时间戳 (timestamp):
- 数据类型: float32
- 形状: [1]
- 帧索引 (frame_index):
- 数据类型: int64
- 形状: [1]
- 集索引 (episode_index):
- 数据类型: int64
- 形状: [1]
- 索引 (index):
- 数据类型: int64
- 形状: [1]
- 任务索引 (task_index):
- 数据类型: int64
- 形状: [1]
引用
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,new_embodiment_v2数据集通过LeRobot框架系统化采集,采用高精度传感器记录机械臂的关节位置与速度数据,同时整合前视与腕部摄像头的视频流。数据以30帧每秒的速率同步捕获,存储为结构化的Parquet格式,确保时序一致性与多模态对齐,每个数据块包含完整的操作序列,支撑机器人动作学习的建模需求。
使用方法
研究者可通过加载Parquet文件直接访问多模态数据流,其中动作与状态字段以浮点数组形式呈现,视频数据可通过路径索引解码。数据集默认划分为训练集,支持端到端策略学习或离线强化学习任务。使用前需配置LeRobot环境,依据帧索引与时间戳实现数据同步,适用于仿真训练或真实机器人控制验证。
背景与挑战
背景概述
机器人学习领域近年来在具身智能方向取得显著进展,new_embodiment_v2数据集作为LeRobot项目的重要组成部分,专注于多模态机器人控制数据的采集与处理。该数据集通过集成机械臂关节位置、末端执行器速度及双视角视觉观测,构建了面向复杂操作任务的强化学习环境。其采用Apache 2.0开源协议,以标准化数据格式支持机器人行为克隆与策略学习研究,为具身智能系统在真实场景中的适应性提供关键数据支撑。
当前挑战
该数据集需解决高维连续动作空间与多模态感知的协同建模难题,包括视觉-运动链路的时空对齐、异构传感器数据的跨模态融合等核心技术瓶颈。在构建过程中面临机械系统标定误差补偿、多视角视频同步采集、大规模运动数据存储优化等工程挑战,同时需确保动作指令与视觉观测间的时间一致性,这对数据采集系统的精确性与稳定性提出极高要求。
常用场景
经典使用场景
在机器人学习领域,new_embodiment_v2数据集为模仿学习与强化学习算法提供了多模态训练范本。其经典应用场景包括机械臂动作轨迹生成与视觉运动协调任务,通过整合前视角与腕部视角的双目视觉输入,结合九维关节位置与速度控制信号,为机器人操作技能的学习建立了完整的感知-动作映射体系。
解决学术问题
该数据集有效解决了机器人操作任务中高维状态-动作空间建模的学术难题,通过提供精确的时间同步多模态数据,支持端到端策略学习研究。其意义在于建立了真实物理环境与算法训练的桥梁,为机器人运动控制、多传感器融合及跨模态表示学习提供了标准化评估基准,推动了具身智能领域的实证研究进展。
实际应用
实际应用中,该数据集可支撑工业自动化场景的机械臂分拣、精密装配等任务算法开发。通过提供真实机械臂(lekiwi_client)的操作数据,能够有效降低实体机器人训练成本,加速服务机器人、医疗机器人等领域的技能迁移应用,为机器人自适应环境交互提供数据驱动解决方案。
数据集最近研究
最新研究方向
在具身智能领域,new_embodiment_v2数据集正推动机器人多模态学习的前沿探索。该数据集通过整合机械臂关节状态、末端执行器视觉信息与运动控制指令,为模仿学习与强化学习算法提供了丰富的多模态交互数据。当前研究聚焦于跨模态表征对齐、时空动作预测等方向,旨在提升机器人对复杂任务的泛化能力。随着具身智能在工业自动化与家庭服务场景的广泛应用,此类高质量数据集已成为开发通用机器人操作系统的关键基础设施,为端到端决策模型的训练与验证提供了重要支撑。
以上内容由遇见数据集搜集并总结生成



