insert_wire_prompt_1

Hugging Face2025-08-27 更新2025-08-28 收录

下载链接：

https://huggingface.co/datasets/eliasab16/insert_wire_prompt_1

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于机器人学任务的数据集，包含10个剧集，共7255帧，1个任务，30个视频和1个片段。数据集提供了多种摄像头视角的视频数据以及其他相关特征，如机器人的动作和状态信息。数据集遵循apache-2.0许可。

创建时间：

2025-08-24

原始信息汇总

数据集概述

基本信息

名称: insert_wire_prompt_1
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

总任务数: 1
总视频数: 30
总片段数: 10
总帧数: 7255
块数: 1
块大小: 1000
帧率: 30 FPS
数据格式: Parquet
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
分割: 训练集 (0:10)

特征描述

动作特征

名称: action
数据类型: float32
形状: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态特征

名称: observation.state
数据类型: float32
形状: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测特征

底部摄像头

名称: observation.images.bottom_cam
数据类型: video
分辨率: 600×800×3
视频编码: av1
像素格式: yuv420p
深度图: 否
音频: 无

侧面摄像头

名称: observation.images.side_cam
数据类型: video
分辨率: 600×800×3
视频编码: av1
像素格式: yuv420p
深度图: 否
音频: 无

顶部摄像头

名称: observation.images.top_cam
数据类型: video
分辨率: 600×800×3
视频编码: av1
像素格式: yuv420p
深度图: 否
音频: 无

元数据特征

timestamp: float32, 形状 [1]
frame_index: int64, 形状 [1]
episode_index: int64, 形状 [1]
index: int64, 形状 [1]
task_index: int64, 形状 [1]

技术信息

代码库版本: v2.1
机器人类型: so101_follower

创建信息

创建工具: LeRobot (https://github.com/huggingface/lerobot)

引用信息

论文: 未提供
BibTeX: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作任务数据采集领域，insert_wire_prompt_1数据集通过LeRobot框架系统性地构建。该数据集包含10个完整操作片段，总计7255帧数据，采用分块存储策略，每个数据块容纳1000帧。数据以30fps的采样频率同步记录多模态信息，包括六维关节状态、三路相机视频流及时间戳元数据，并以标准化parquet格式进行高效存储。

特点

该数据集的核心特征体现在其丰富的多模态观测体系与精细的结构化标注。观测系统集成底部、侧部和顶部三个视角的高清视频流，分辨率达800×600，采用AV1编码保障存储效率。动作空间完整覆盖六自由度机械臂的关节位置控制指令，包括肩部平移、肩部抬升、肘部屈伸及腕部多维运动。每个数据帧均附带精确的时间索引与任务标识，支持时序分析与任务语义关联研究。

使用方法

研究者可通过HuggingFace数据平台直接加载该数据集，利用标准接口解析parquet格式的帧序列数据。训练集包含全部10个操作片段，适用于模仿学习与行为克隆算法开发。多路视频流与关节状态数据的时空对齐特性，使其特别适合跨模态表征学习研究。数据集遵循Apache 2.0许可协议，支持学术与工业领域的机器人控制算法创新与验证。

背景与挑战

背景概述

机器人操作数据集insert_wire_prompt_1由HuggingFace的LeRobot项目构建，专注于多视角视觉与机械臂控制任务的深度融合。该数据集采用Apache 2.0许可协议，通过SO101型跟随机器人采集了10个完整操作序列，共计7255帧多模态数据，涵盖底部、侧部和顶部三个相机视角的高清视频流及六自由度关节控制信号。其设计初衷在于推动基于视觉的模仿学习与强化学习算法在真实场景中的泛化能力，为机器人精细操作任务提供标准化评估基准。

当前挑战

该数据集核心挑战在于解决多模态时序数据的对齐与标注一致性，需同步处理每秒30帧的三路视频流与机械臂状态数据。构建过程中面临传感器异构同步、大规模视频数据压缩存储（采用AV1编解码）及动作空间标准化等工程难题。领域层面需克服视觉-动作映射的模糊性、动态遮挡环境下状态感知的可靠性，以及有限样本下策略泛化到未知场景的适应性挑战。

常用场景

经典使用场景

在机器人操作学习领域，该数据集通过多视角视觉观测与关节状态数据，为模仿学习算法提供了丰富的训练素材。其经典使用场景集中于机械臂动作轨迹的生成与优化，研究者可利用该数据集训练端到端的策略网络，使机器人能够从视觉输入中直接推断出关节控制指令，实现精准的物体抓取与放置任务。

衍生相关工作

该数据集催生了多项机器人学习领域的创新研究，包括基于视觉预测模型的机械臂动作规划算法、多传感器融合的强化学习框架等。这些工作通过扩展数据集的应用维度，发展了更高效的跨模态表示学习方法，为后续的机器人操作技能迁移研究奠定了坚实基础。

数据集最近研究