pusht2-teleop

Hugging Face2026-01-08 更新2026-01-09 收录

下载链接：

https://huggingface.co/datasets/you2who/pusht2-teleop

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术领域。包含240个episodes，42702帧数据，帧率为10fps。数据以parquet格式存储，包含多种特征如观察状态（包括电机状态）、动作、时间戳、奖励、完成状态、成功状态、图像观察等。图像观察为96x96像素的3通道视频数据。数据集结构详细，包含训练集划分、数据路径、视频路径等信息。

创建时间：

2026-01-06

原始信息汇总

数据集概述

基本信息

数据集名称: pusht2-teleop
托管地址: https://huggingface.co/datasets/you2who/pusht2-teleop
创建工具: 使用 LeRobot (https://github.com/huggingface/lerobot) 创建。
许可证: Apache License 2.0
任务类别: 机器人学
标签: LeRobot

数据集规模与结构

总情节数: 240
总帧数: 42702
总任务数: 1
总视频数: 240
数据块数: 1
数据块大小: 1000
帧率: 10 FPS
数据分割: 全部数据（索引 0 至 240）用于训练。

数据文件

数据文件路径模式: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件路径模式: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

数据特征

数据集包含以下特征字段及其数据类型、形状和描述：

观测数据

observation.state
- 数据类型: float32
- 形状: [2]
- 描述: 代表两个电机（motor_0, motor_1）的状态。
observation.image
- 数据类型: video
- 形状: [96, 96, 3]
- 描述: 视频帧图像，维度为高度、宽度、通道。
- 视频信息:
  - 帧率: 10.0
  - 高度: 96 像素
  - 宽度: 96 像素
  - 通道数: 3
  - 视频编码: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 是否包含音频: false

动作与元数据

action
- 数据类型: float32
- 形状: [2]
- 描述: 代表两个电机（motor_0, motor_1）的动作。
timestamp
- 数据类型: float32
- 形状: [1]
frame_index
- 数据类型: int64
- 形状: [1]
episode_index
- 数据类型: int64
- 形状: [1]
index
- 数据类型: int64
- 形状: [1]
task_index
- 数据类型: int64
- 形状: [1]

下一时刻信息

next.reward
- 数据类型: float32
- 形状: [1]
next.done
- 数据类型: bool
- 形状: [1]
next.success
- 数据类型: bool
- 形状: [1]

引用信息

主页: [More Information Needed]
论文: [More Information Needed]
BibTeX 引用: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人遥操作领域，pusht2-teleop数据集通过LeRobot平台精心构建，旨在为机器人控制研究提供高质量的交互数据。该数据集收录了240个完整交互片段，总计42702帧数据，以每秒10帧的速率记录。数据以Parquet格式存储，每个片段包含状态观测、动作指令、时间戳及后续反馈等关键信息，结构清晰且便于高效访问。

特点

pusht2-teleop数据集在机器人学习领域展现出鲜明的技术特色，其观测数据融合了二维电机状态与96x96像素的三通道视觉图像，提供了多模态感知信息。数据标注涵盖了奖励信号、完成标志及成功标识，支持强化学习与行为克隆等任务。所有数据统一划分为训练集，确保了模型训练的连贯性与一致性。

使用方法

研究人员可利用该数据集进行机器人策略学习与评估，通过加载Parquet文件直接访问结构化数据。数据特征包括观测状态、动作空间及时间序列信息，适用于训练端到端控制模型或分析遥操作行为模式。结合附带的视频文件，用户能够直观验证模型输出与实际操作的对应关系，提升实验的可解释性。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究日益深入，对高质量、大规模交互数据的需求愈发迫切。pusht2-teleop数据集由HuggingFace的LeRobot项目团队创建，旨在为机器人操作任务提供丰富的遥操作演示数据。该数据集收录了240个完整交互片段，共计超过4万帧数据，涵盖了状态观测、动作指令、奖励信号及视觉图像等多模态信息，为开发端到端的机器人控制策略奠定了坚实基础。其核心研究问题聚焦于如何利用人类演示数据提升机器人在复杂环境中的自主操作能力，对推动机器人模仿学习与离线强化学习算法的发展具有显著影响力。

当前挑战

pusht2-teleop数据集所针对的机器人操作任务面临诸多挑战，包括高维连续动作空间的精确建模、视觉观测与低维状态信息的有效对齐，以及稀疏奖励信号下的长期决策优化。在数据集构建过程中，研究人员需克服数据采集的实时同步难题，确保多传感器数据在时间上的一致性；同时，遥操作演示的质量与多样性也构成关键挑战，需平衡人类操作者的技能差异与任务覆盖范围，以生成具有广泛泛化能力的训练样本。此外，数据标注与结构化存储亦需精心设计，以支持高效的大规模机器学习训练流程。

常用场景

经典使用场景

在机器人学习领域，pusht2-teleop数据集作为远程操作任务的基准资源，其经典使用场景聚焦于模仿学习与行为克隆算法的训练与验证。该数据集通过记录操作员对机器人执行推送动作的遥测数据，包括状态观测、动作指令及视觉反馈，为研究者提供了丰富的交互轨迹。这些轨迹能够直接用于训练策略网络，使机器人学习如何模仿人类操作者的精细控制行为，从而在仿真或真实环境中复现复杂的物理交互任务。

解决学术问题

该数据集有效解决了机器人学中样本效率低下与泛化能力不足的常见学术问题。通过提供大规模、结构化的交互数据，它支持数据驱动的强化学习与模仿学习研究，降低了在真实机器人上收集数据的成本与风险。其多模态特征融合了图像、状态与动作信息，有助于探索感知与控制一体化的端到端学习框架，推动了机器人自主技能获取的理论进展，并为算法在不确定环境中的鲁棒性评估提供了实证基础。

衍生相关工作

围绕pusht2-teleop数据集，已衍生出一系列经典研究工作，特别是在机器人模仿学习与离线强化学习方向。许多研究利用其提供的轨迹数据，开发了高效的行为克隆算法，提升了策略在稀疏奖励环境下的表现。同时，该数据集也启发了多任务学习框架的探索，研究者通过分析其状态-动作对，构建了更具泛化能力的表示学习方法，为后续机器人数据集的构建与标准化提供了重要参考。

以上内容由遇见数据集搜集并总结生成