push_insert_top_cam_full

Hugging Face2025-07-22 更新2025-07-23 收录

下载链接：

https://huggingface.co/datasets/aractingi/push_insert_top_cam_full

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot创建，包含与机器人学相关的任务数据。数据集的结构在meta/info.json文件中定义，其中包括15个视频文件，总共599帧，1个任务，数据以.parquet和.mp4格式存储。数据集的每个数据点包括状态、动作、奖励、完成标志、惩罚、图像、时间戳、帧索引、集索引和任务索引等信息。数据集采用Apache-2.0许可证。

创建时间：

2025-07-10

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

配置名称: default
数据文件: data//.parquet
代码库版本: v2.1
机器人类型: 未指定
总集数: 15
总帧数: 599
总任务数: 1
总视频数: 15
总块数: 1
块大小: 1000
帧率: 10 fps
分割:
- 训练集: 0:15

数据路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

observation.state:
- 数据类型: float32
- 形状: [21]
- 名称: 未指定
action:
- 数据类型: float32
- 形状: [3]
- 名称: delta_x_ee, delta_y_ee, delta_z_ee
next.reward:
- 数据类型: float32
- 形状: [1]
- 名称: 未指定
next.done:
- 数据类型: bool
- 形状: [1]
- 名称: 未指定
complementary_info.discrete_penalty:
- 数据类型: float32
- 形状: [1]
- 名称: discrete_penalty
observation.images.front:
- 数据类型: video
- 形状: [3, 128, 128]
- 名称: channels, height, width
- 信息:
  - 视频高度: 128
  - 视频宽度: 128
  - 视频编解码器: av1
  - 视频像素格式: yuv420p
  - 是否为深度图: false
  - 视频帧率: 10 fps
  - 视频通道数: 3
  - 是否有音频: false
timestamp:
- 数据类型: float32
- 形状: [1]
- 名称: 未指定
frame_index:
- 数据类型: int64
- 形状: [1]
- 名称: 未指定
episode_index:
- 数据类型: int64
- 形状: [1]
- 名称: 未指定
index:
- 数据类型: int64
- 形状: [1]
- 名称: 未指定
task_index:
- 数据类型: int64
- 形状: [1]
- 名称: 未指定

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，push_insert_top_cam_full数据集基于LeRobot平台精心构建，采用先进的实验范式收集多模态数据。该数据集包含15个完整的情节序列，共计599帧数据，以10fps的采样率捕获机器人操作过程中的状态变化。数据以分块存储的Parquet格式组织，每个情节包含21维状态观测值、3维末端执行器动作向量，并辅以128×128分辨率的三通道前视摄像头视频流，通过严格的时序对齐确保数据一致性。

特点

该数据集显著特点在于其多维度的机器人操作数据融合，不仅记录机械臂末端执行器的三维位移动作（delta_x_ee/delta_y_ee/delta_z_ee），还同步采集包含离散惩罚信号的任务奖励机制。前视视觉数据采用AV1编码的彩色视频流，配合精确到0.1秒的时间戳标注，形成时空对齐的多模态观测体系。所有特征字段均采用标准化数据结构，包括float32型的状态向量和int64型的索引标识，为模仿学习与强化学习算法提供结构化输入。

使用方法

研究者可通过解析Parquet文件直接访问帧级机器人操作数据，配合MP4格式的视频文件实现视觉-动作联合分析。数据已预分割为训练集（0-15全部情节），建议采用帧索引（frame_index）与情节编号（episode_index）进行数据遍历。观测状态与动作空间的明确维度定义（21维/3维）便于构建端到端策略网络，而离散惩罚特征（discrete_penalty）可用于设计定制化奖励函数。视频数据的高度一致性（128×128@10fps）特别适合时空特征提取模型的训练。

背景与挑战

背景概述

push_insert_top_cam_full数据集由LeRobot团队创建，专注于机器人操作任务的研究。该数据集通过记录机械臂在三维空间中的运动轨迹、末端执行器的位置变化以及视觉观察数据，为机器人学习复杂操作技能提供了丰富的实验数据。数据集包含15个完整的工作周期，共计599帧数据，涵盖了机械臂的推、插等基本操作任务，为机器人强化学习和模仿学习算法的开发与验证提供了重要支持。

当前挑战

该数据集面临的挑战主要体现在两个方面：在领域问题方面，如何准确捕捉机械臂在复杂操作任务中的动态特性，以及如何有效利用有限的视觉和状态数据进行高效学习，是当前机器人操作研究中的核心难题；在构建过程中，数据采集的同步性、传感器噪声的抑制以及高维数据的存储与处理等技术问题也对数据集的构建提出了较高要求。

常用场景

经典使用场景

在机器人操作任务的研究中，push_insert_top_cam_full数据集被广泛用于训练和评估机械臂的精确控制能力。该数据集通过记录机械臂在三维空间中的运动轨迹和末端执行器的位置变化，为研究者提供了丰富的实验数据。这些数据特别适用于研究机械臂在复杂环境中的路径规划和动作优化问题，为机器人操作任务的算法开发奠定了坚实基础。

实际应用

在实际应用中，push_insert_top_cam_full数据集被广泛用于工业自动化领域的机械臂控制系统开发。例如，在装配线上，机械臂需要精确地将零件插入指定位置，该数据集提供的运动轨迹和动作数据可以直接用于优化机械臂的控制算法，提高生产效率和操作精度。此外，该数据集还可用于开发智能仓储系统中的货物分拣机器人。

衍生相关工作

基于push_insert_top_cam_full数据集，研究者们开发了多种经典的机器人操作算法。例如，一些工作利用该数据集训练了基于深度强化学习的机械臂控制模型，显著提高了机械臂在复杂环境中的操作精度。另一些研究则结合该数据集开发了多模态感知模型，将视觉信息与运动轨迹数据融合，进一步提升了机器人操作任务的智能化水平。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集