tape_placement

Hugging Face2026-01-09 更新2026-01-10 收录

下载链接：

https://huggingface.co/datasets/yeeunleee/tape_placement

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人数据集，包含与机器人类型'so101_follower'相关的100个episodes、38707帧和1个任务。数据包括动作、观测（状态和来自两个摄像头的图像）、时间戳和各种索引。数据以parquet文件格式存储，并包含特定编解码器和格式的视频文件。

创建时间：

2026-01-09

原始信息汇总

数据集概述

基本信息

数据集名称: tape_placement
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可协议: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集规模

总任务数: 1
总情节数: 100
总帧数: 38707
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据块大小: 1000

数据集结构

数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
训练集划分: 包含全部100个情节 (索引0到100)

数据特征

动作

数据类型: float32
形状: [6]
维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测状态

数据类型: float32
形状: [6]
维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测图像 (camera1)

数据类型: 视频
形状: [480, 640, 3]
维度名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30
- 通道数: 3
- 包含音频: 否

观测图像 (camera2)

数据类型: 视频
形状: [480, 640, 3]
维度名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30
- 通道数: 3
- 包含音频: 否

元数据

时间戳: float32, 形状 [1]
帧索引: int64, 形状 [1]
情节索引: int64, 形状 [1]
索引: int64, 形状 [1]
任务索引: int64, 形状 [1]

机器人信息

机器人类型: so101_follower
代码库版本: v3.0

引用信息

主页: [More Information Needed]
论文: [More Information Needed]
BibTeX引用: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作任务领域，tape_placement数据集通过LeRobot平台精心构建，旨在记录机械臂执行胶带粘贴任务的完整过程。该数据集采集自so101_follower型号机器人，总计包含100个完整任务片段，覆盖了38707帧数据，以30帧每秒的速率同步录制双视角视觉信息与六维关节状态。数据以分块形式存储于Parquet文件中，每块约1000帧，确保了高效的数据管理与访问，同时辅以AV1编码的MP4格式视频，清晰呈现任务执行时的环境动态与机器人动作细节。

特点

tape_placement数据集展现出多模态融合的显著特点，不仅整合了机器人六自由度关节的位置信息作为动作与状态观测，还同步提供了两个独立摄像头捕捉的480x640分辨率RGB视频流，形成丰富的时空感知数据。数据集结构严谨，每帧数据均附带时间戳、帧索引及任务索引等元数据，支持精确的时序对齐与任务分析。其统一的数据格式与分块存储设计，兼顾了大规模机器人演示数据的高效存取与深度学习模型训练的需求，为模仿学习与强化学习算法提供了高质量的真实世界交互样本。

使用方法

研究者可利用该数据集进行机器人技能学习与行为克隆等前沿探索。通过加载Parquet文件，可以便捷地访问每一帧的关节动作、机器人状态及对应的双视角图像序列，构建端到端的策略学习管道。数据集已预设训练集划分，支持直接用于模型训练与验证。结合LeRobot提供的工具链，用户能够进一步进行数据可视化、轨迹回放或特征提取，从而深入分析机器人操作模式，开发鲁棒的控制策略，推动实体机器人灵巧操作能力的进步。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究依赖于高质量、大规模的真实世界交互数据。tape_placement数据集由LeRobot项目团队构建，旨在为机器人操作任务提供丰富的多模态演示数据。该数据集聚焦于机器人灵巧操作中的胶带放置任务，通过整合关节状态、视觉观测与动作指令，为训练端到端的机器人控制策略奠定了数据基础。其构建体现了开源社区在推动机器人泛化能力与数据驱动方法发展上的努力，尽管具体创建时间与核心论文信息尚未公开，但其结构设计已展现出对机器人学习标准化数据集的贡献潜力。

当前挑战

tape_placement数据集致力于解决机器人操作中的物体精确放置问题，这一任务要求模型理解视觉场景、规划连续动作并适应物理交互中的不确定性。挑战在于如何从高维视觉与状态数据中提取有效特征，以实现鲁棒且泛化的策略学习。在数据构建过程中，团队需克服真实世界数据采集的复杂性，包括传感器同步、多视角视觉对齐以及动作标注的准确性。此外，确保数据规模与多样性以覆盖任务变体，同时处理大规模视频存储与高效访问，亦是数据集构建中的关键难点。

常用场景

经典使用场景

在机器人操作领域，tape_placement数据集为机器人灵巧操作任务提供了丰富的多模态数据资源。该数据集通过记录机械臂执行胶带粘贴任务的完整过程，包含关节状态、视觉观测和时间戳等信息，常用于训练和评估机器人模仿学习与强化学习算法。研究者利用这些数据开发模型，使机器人能够从人类示范中学习复杂的操作技能，实现精准的物体操控和环境交互。

衍生相关工作

围绕tape_placement数据集，衍生出多项经典研究工作，主要集中在机器人行为克隆和视觉运动策略学习领域。例如，结合Transformer架构的序列建模方法利用其多模态数据提升了策略的鲁棒性；同时，该数据集也促进了跨任务迁移学习框架的发展，为机器人多技能学习提供了实验基础，推动了开源机器人社区的数据驱动研究浪潮。

数据集最近研究