Master_wire_bend_varying_3wire_20260319

Hugging Face2026-04-02 更新2026-04-03 收录

下载链接：

https://huggingface.co/datasets/Factory-Intelligence/Master_wire_bend_varying_3wire_20260319

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot项目创建，专为机器人技术研究设计。数据集包含88个总片段，287160帧数据，涉及2个任务。数据以Parquet文件和MP4视频形式存储，总数据文件大小为100MB，视频文件大小为200MB。数据集提供了丰富的特征，包括7个关节位置的动作数据、观察状态数据、来自全局和手腕摄像头的图像数据（分辨率480x640，30fps），以及时间戳、帧索引、片段索引和任务索引等。数据集适用于机器人控制、行为模仿和视觉导航等任务的研究。

创建时间：

2026-03-28

原始信息汇总

数据集概述

基本信息

数据集名称: Master_wire_bend_varying_3wire_20260319
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学

数据集规模与结构

总情节数: 88
总帧数: 287160
总任务数: 2
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (0:88)

数据文件与路径

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作特征

特征名: action
数据类型: float32
形状: [7]
包含信息: joint_0.pos, joint_1.pos, joint_2.pos, joint_3.pos, joint_4.pos, joint_5.pos, gripper.pos

观测特征

状态观测

特征名: observation.state
数据类型: float32
形状: [7]
包含信息: joint_0.pos, joint_1.pos, joint_2.pos, joint_3.pos, joint_4.pos, joint_5.pos, gripper.pos

图像观测 - 全局摄像头

特征名: observation.images.cam_global
数据类型: video
形状: [480, 640, 3]
视频信息:
- 高度: 480 像素
- 宽度: 640 像素
- 通道数: 3
- 编解码器: h264
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30 FPS
- 是否包含音频: 否

图像观测 - 腕部摄像头

特征名: observation.images.cam_wrist
数据类型: video
形状: [480, 640, 3]
视频信息:
- 高度: 480 像素
- 宽度: 640 像素
- 通道数: 3
- 编解码器: h264
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30 FPS
- 是否包含音频: 否

元数据特征

时间戳: timestamp (float32, 形状 [1])
帧索引: frame_index (int64, 形状 [1])
情节索引: episode_index (int64, 形状 [1])
索引: index (int64, 形状 [1])
任务索引: task_index (int64, 形状 [1])

技术信息

代码库版本: v3.0
机器人类型: yam_follower

搜集汇总

数据集介绍

构建方式

在机器人操作学习领域，数据集的构建质量直接影响模型泛化能力。Master_wire_bend_varying_3wire_20260319数据集依托LeRobot平台，通过雅马哈跟随者机器人执行电线弯曲任务采集而成。该数据集包含88个完整操作片段，总计287,160帧数据，以30帧每秒的速率记录。数据以分块Parquet格式存储，每块约1000帧，同时配有两路视角（全局与腕部）的高清视频，视频编码采用H.264标准，分辨率达640x480，确保了时空信息的完整性与可追溯性。

特点

该数据集在机器人感知与控制融合方面展现出显著特色。其多维特征结构涵盖七自由度关节位置与夹爪状态，并同步提供双视角RGB视频流，形成多模态观测空间。数据组织遵循严格的时间索引，每帧均标注时间戳、帧索引与任务索引，支持长时序依赖分析。所有数据均经过归一化处理，动作与状态特征以float32格式存储，兼顾精度与存储效率，为模仿学习与强化学习算法提供了结构化的训练基础。

使用方法

针对机器人技能学习的研究需求，该数据集可直接用于端到端策略训练。研究者可通过加载Parquet文件获取状态-动作对序列，并利用附带的视频路径关联视觉观测。数据已预设训练集划分，涵盖全部88个片段，支持批量加载与流式处理。典型应用包括行为克隆、逆动力学建模以及跨模态表示学习，通过整合关节控制信号与双视角视觉输入，可有效建模复杂操作任务中的空间推理与运动规划问题。

背景与挑战

背景概述

在机器人操作领域，实现对柔性物体的精确控制是一项长期存在的复杂挑战。Master_wire_bend_varying_3wire_20260319数据集应运而生，由LeRobot项目团队于2024年创建，旨在推动机器人学习在精细操作任务上的研究。该数据集聚焦于多股线缆的弯曲变形任务，核心研究问题在于如何使机器人能够理解并执行对非刚性、可变形物体的灵巧操作。通过提供包含关节状态、夹爪动作以及多视角视觉观测的高质量演示数据，该数据集为开发能够适应物体形变和物理交互的机器人策略模型奠定了关键基础，对提升机器人在装配、护理等实际场景中的自主能力具有重要影响力。

当前挑战

该数据集致力于解决机器人操作中针对可变形物体的轨迹学习与策略泛化挑战。具体而言，线缆的连续形变特性、多股线束间的复杂物理交互，以及操作过程对视觉-动作协调的高精度要求，共同构成了一个极具难度的仿真与真实世界衔接问题。在构建过程中，挑战同样显著：需要设计能够稳定、重复地执行精细弯曲动作的机器人平台；确保从全局和腕部摄像头采集的同步视觉数据具备高保真度与时空一致性；并以高效的数据结构组织长达287,160帧的多模态序列，以支持大规模离线强化学习或模仿学习算法的训练需求。

常用场景

经典使用场景

在机器人操作领域，Master_wire_bend_varying_3wire_20260319数据集为研究多线弯曲任务提供了丰富的演示数据。该数据集通过记录机械臂在三维空间中的关节位置、夹爪状态以及多视角视觉信息，构建了完整的操作轨迹序列。研究人员可利用这些数据训练模仿学习或强化学习模型，使机器人能够学习复杂的柔性物体操作技能，特别是在工业装配或电子制造场景中，实现对多根线材的精确弯曲与成型。

衍生相关工作

围绕该数据集，已衍生出一系列专注于机器人模仿学习与视觉运动策略的研究工作。例如，基于行为克隆的方法利用其状态-动作对训练端到端策略网络；而逆强化学习研究则从中提取奖励函数以解释演示行为。此外，结合该数据集的视觉信息，研究工作在跨视角表征学习、时序动作预测以及多任务泛化等方面取得了进展，进一步拓展了数据驱动机器人技能学习的边界。

数据集最近研究