put_battery_compartment_into_basket

Hugging Face2025-08-02 更新2025-08-03 收录

下载链接：

https://huggingface.co/datasets/zhenxuan/put_battery_compartment_into_basket

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于机器人任务的 dataset，包含了21个剧集，共计12949帧，1个任务，42个视频。数据集以 Apache-2.0 协议发布，数据类型包括机器人的动作、状态、正面和 overhead 视频信息等。

创建时间：

2025-07-31

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: 机器人学 (robotics)
相关标签: LeRobot

数据集描述

创建工具: LeRobot
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

数据文件格式: Parquet
配置名称: default
数据文件路径: data//.parquet

元数据信息

代码库版本: v2.1
机器人类型: pingti_follower
总集数: 21
总帧数: 12949
总任务数: 1
总视频数: 42
总块数: 1
块大小: 1000
帧率: 30 fps
分割: 训练集 (0:21)

数据路径

数据路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像 (observation.images.front 和 observation.images.overhead):
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息:
  - 高度: 480
  - 宽度: 640
  - 编码: av1
  - 像素格式: yuv420p
  - 深度图: false
  - 帧率: 30 fps
  - 通道: 3
  - 音频: false
时间戳 (timestamp):
- 数据类型: float32
- 形状: [1]
帧索引 (frame_index):
- 数据类型: int64
- 形状: [1]
集索引 (episode_index):
- 数据类型: int64
- 形状: [1]
索引 (index):
- 数据类型: int64
- 形状: [1]
任务索引 (task_index):
- 数据类型: int64
- 形状: [1]

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作任务数据采集领域，put_battery_compartment_into_basket数据集通过LeRobot平台系统化构建。该数据集采用高精度机械臂pingti_follower执行单一任务，采集了21条完整操作序列，共计12949帧时序数据。数据以30fps同步记录六维关节角度动作指令、双视角视觉观测（前视与俯视摄像头）及时间戳元数据，并以分块parquet格式高效存储，确保数据完整性与读取效率。

特点

该数据集显著特征体现在多模态数据的高度结构化组织，包含6自由度机械臂的连续动作空间与对应状态观测。视觉维度提供480x640分辨率双视角RGB视频流，精确记录操作过程中的空间关系变化。数据字段涵盖动作指令、关节状态、图像帧、时间索引等多层次信息，且所有数据均附带完整的元描述规范，支持机器人强化学习与模仿学习算法的端到端训练。

使用方法

研究者可通过HuggingFace数据加载工具直接访问该数据集，按照标准parquet格式解析数据块。典型应用流程包括：加载动作-观测配对序列训练行为克隆模型，或利用双视角视觉输入构建视觉运动策略网络。数据集的帧索引与分块设计支持流式读取，适用于批量训练与验证集划分，具体任务可聚焦于机械臂抓放操作的跨模态表示学习与策略优化。

背景与挑战

背景概述

机器人操作任务数据集put_battery_compartment_into_basket由HuggingFace的LeRobot项目团队构建，专注于家庭环境中的精细物体操作研究。该数据集采用Apache 2.0开源协议，通过PingTi Follower机器人平台采集了21个完整操作序列，共计12949帧多模态数据。其核心价值在于提供了机械臂关节状态、双视角视觉观测与动作指令的同步记录，为模仿学习与强化学习算法在真实场景中的应用建立了重要基准。

当前挑战

该数据集致力于解决机器人精细操作中的视觉-动作协同挑战，特别是电池舱抓取与放置任务的姿态泛化问题。构建过程中面临多传感器时序对齐、高维动作空间采样效率、以及真实环境光照变化干扰等技术难点。数据规模受限与任务单一性进一步制约了模型的跨任务迁移能力，对表征学习和sim2real迁移提出了更高要求。

常用场景

经典使用场景

在机器人操作学习领域，该数据集通过记录机械臂执行电池舱放置任务的完整运动轨迹与视觉信息，为模仿学习算法提供高质量示范数据。研究者可利用其多模态观测数据（包括关节角度、前视与俯视相机视频流）训练端到端的策略网络，使机器人学会精确的抓取与放置动作序列。

实际应用

在工业自动化场景中，该数据集可直接应用于物流分拣系统的机械臂控制优化，实现电池类元件的精准抓取与容器放置。其提供的真实机器人操作数据能够降低实际部署时的调试成本，为仓储机器人、电子产品组装线等场景提供即插即用的示范数据支撑。

衍生相关工作

基于该数据集衍生了多项机器人操作领域的经典研究，包括基于时空注意力的视觉运动策略网络、多视角视觉特征融合方法以及跨模态示范数据增强技术。这些工作显著提升了机械臂在复杂环境下的操作精度与泛化能力，形成了机器人学习领域的重要技术脉络。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集