virtual_teleop_pickplace_30fps

Hugging Face2026-01-29 更新2026-01-30 收录

下载链接：

https://huggingface.co/datasets/StefanWagnerWandelbots/virtual_teleop_pickplace_30fps

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是通过LeRobot创建的，专注于机器人技术领域，采用Apache-2.0许可证。数据集包含375个episodes，总计171441帧，涉及1个任务。数据以parquet格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构包括训练集（0:375）。特征部分详细描述了动作（7个关节位置和夹爪位置）、观察状态（同样7个关节位置和夹爪位置）、以及来自不同视角（flange、left、right）的图像观察，图像分辨率为480x640，3通道，视频编码为av1。此外，还包含时间戳、帧索引、episode索引、任务索引等信息。该数据集适用于机器人控制、行为克隆等任务。

创建时间：

2026-01-27

原始信息汇总

数据集概述

基本信息

数据集名称: virtual_teleop_pickplace_30fps
创建工具: 使用 LeRobot 创建
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集规模与结构

总情节数: 375
总帧数: 171441
总任务数: 1
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (0:375)
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
形状: [7]
名称: joint_1.pos, joint_2.pos, joint_3.pos, joint_4.pos, joint_5.pos, joint_6.pos, gripper.pos

观测状态

数据类型: float32
形状: [7]
名称: joint_1.pos, joint_2.pos, joint_3.pos, joint_4.pos, joint_5.pos, joint_6.pos, gripper.pos

观测图像（法兰摄像头）

数据类型: 视频
形状: [480, 640, 3]
名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

观测图像（左摄像头）

数据类型: 视频
形状: [480, 640, 3]
名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

观测图像（右摄像头）

数据类型: 视频
形状: [480, 640, 3]
名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

其他特征

时间戳: 数据类型 float32，形状 [1]
帧索引: 数据类型 int64，形状 [1]
情节索引: 数据类型 int64，形状 [1]
索引: 数据类型 int64，形状 [1]
任务索引: 数据类型 int64，形状 [1]

元数据

代码库版本: v3.0
机器人类型: nova

引用信息

主页: [More Information Needed]
论文: [More Information Needed]
BibTeX 引用: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量仿真数据的采集对于模型训练至关重要。virtual_teleop_pickplace_30fps数据集依托LeRobot平台构建，通过虚拟遥操作方式记录了Nova机器人执行拾放任务的连续交互过程。该数据集包含375个完整任务片段，总计171,441帧数据，以30帧每秒的速率采集，确保了动作与观测的时序连贯性。数据以分块Parquet格式存储，每块约1000帧，并辅以同步录制的多视角视频，形成了结构化的机器人状态-动作对序列。

使用方法

研究者可通过HuggingFace数据集库直接加载该数据集，利用其预定义的数据路径与特征结构进行访问。数据按训练集划分，可直接用于机器人拾放任务的策略学习。典型使用流程包括：解析Parquet文件中的状态、动作与元数据；同步读取对应MP4格式的视频文件以获取视觉观测；依据时间戳与帧索引构建序列样本。由于数据集已统一预处理并标准化，用户可专注于模型设计与训练，无需额外处理数据对齐或格式转换问题。

背景与挑战

背景概述

在机器人操作领域，虚拟仿真环境为算法训练提供了安全、可扩展且成本效益显著的数据采集平台。virtual_teleop_pickplace_30fps数据集依托LeRobot开源框架构建，专注于拾放任务的远程操作数据记录。该数据集由HuggingFace社区贡献，采用Apache 2.0许可协议，收录了375个完整操作序列，总计超过17万帧多模态数据。其核心价值在于通过高帧率同步记录机械臂关节状态、夹爪控制信号及多视角视觉流，为模仿学习与强化学习算法提供了结构化的训练资源，有效推动了机器人灵巧操作技术的实证研究进程。

当前挑战

该数据集致力于解决机器人拾放任务中动作策略泛化能力不足的经典难题，其挑战首先体现在复杂场景下的动作-视觉对齐问题，多视角视频流与七维连续动作空间的高精度同步要求对时序一致性提出严峻考验。构建过程中面临仿真到现实迁移的固有障碍，虚拟环境中的物理参数偏差可能导致策略在实际机器人部署时出现性能衰减。数据规模虽达数百个任务序列，但单一任务类型的局限性可能制约模型在多样化物体操作场景中的适应能力，且缺乏公开论文与详细技术文档，为学术复现与深度分析方法验证带来不确定性。

常用场景

经典使用场景

在机器人操作领域，虚拟仿真环境为算法验证提供了高效且安全的平台。virtual_teleop_pickplace_30fps数据集以其高帧率视频流和多视角图像数据，成为训练机器人抓取与放置任务的经典资源。研究者利用该数据集中的关节位置、夹爪状态及视觉观测，能够构建端到端的模仿学习或强化学习模型，模拟真实世界中的物体操控过程，从而优化机器人的动作规划与执行精度。

解决学术问题

该数据集有效应对了机器人学中样本效率低下与真实实验成本高昂的挑战。通过提供大规模、结构化的虚拟交互数据，它支持了从视觉感知到动作生成的映射研究，促进了基于学习的控制策略发展。其意义在于降低了算法开发门槛，加速了抓取操作领域的理论探索，为泛化性与鲁棒性研究奠定了数据基础。

实际应用

在实际工业自动化场景中，该数据集可直接用于训练机器人执行分拣、装配等精细操作。基于其多视角视觉输入与精确动作记录，工程师能够开发出适应不同物体形状与环境的自适应控制系统。这不仅提升了生产线的灵活性与效率，也为服务机器人或物流仓储中的自主抓取任务提供了可靠的技术验证途径。

数据集最近研究