ajaysri/test_pick_place_arx_lerobot_v3

Name: ajaysri/test_pick_place_arx_lerobot_v3
Creator: ajaysri
Published: 2026-04-30 11:33:03
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/ajaysri/test_pick_place_arx_lerobot_v3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个用于机器人技术研究的数据集，专注于拾取和放置任务。数据集由LeRobot创建，包含50个episodes，总计11779帧数据。数据集结构包括状态（7维浮点数）、速度（6维浮点数）、动作（7维浮点数）等多种特征，以及左右和头顶视角的视频数据（分辨率360x640，60fps）。数据以parquet格式存储，视频以mp4格式存储。数据集采用Apache 2.0许可证。

This dataset is designed for robotics research, specifically focusing on pick and place tasks. It was created using LeRobot and contains 50 episodes with a total of 11,779 frames. The dataset structure includes various features such as state (7-dimensional float), velocity (6-dimensional float), action (7-dimensional float), as well as video data from left and overhead perspectives (resolution 360x640, 60fps). The data is stored in parquet format, and videos are stored in mp4 format. The dataset is licensed under Apache 2.0.

提供机构：

ajaysri

搜集汇总

数据集介绍

构建方式

本数据集依托于LeRobot框架构建，专为机器人抓取与放置（Pick-Place）任务设计，采集自ARX机器人平台。通过遥操作（Teleop）方式，在真实环境中记录了50个完整演示片段（Episodes），总计11779帧数据，涵盖单一任务类型。数据以Parquet格式存储结构化信息，并辅以H.264编码的视频文件，分别放置于data与videos目录下，采用分块（Chunk）索引管理，确保高效存取与扩展性。

特点

数据集的核心特点在于其高保真度与多模态融合。观测数据包含7维状态向量（如关节位置）与6维速度向量，同时提供640×360分辨率的左右与俯视双视角视频流，以60帧/秒的帧率捕捉动态细节。动作空间同为7维，与状态空间对称，便于策略学习。此外，数据附有时间戳、帧索引、片段索引等元信息，支持精细化的时间序列分析与任务对齐。

使用方法

使用者可通过LeRobot库轻松加载并可视化数据集，其Hugging Face Space提供了交互式浏览接口。推荐将数据按单一训练集划分（0至49个片段），用于模仿学习或强化学习算法的训练。视频数据以Chunk分片组织，兼容常见的时序模型输入；Parquet表格数据则便于提取状态-动作对进行行为克隆。研究者可利用其多视角视觉与运动学信息，开发鲁棒的操作策略或进行跨任务迁移学习。

背景与挑战

背景概述

随着机器人学习领域的蓬勃发展，基于人类遥操作的高质量演示数据集成为推动技能学习与泛化的关键基石。由ajaysri创建、依托LeRobot框架构建的test_pick_place_arx_lerobot_v3数据集，诞生于对操作任务数据标准化与可复现性的追求之中。该数据集聚焦于Arx系列机器人执行“抓取-放置”这一基础操作任务，包含50个演示片段、总计11779帧高频率（60 FPS）观测数据，涵盖多视角视觉信息（左侧与俯瞰摄像头）及7维状态与动作空间。作为LeRobot生态中的测试型数据集，它以Apache-2.0许可证开放，旨在为机器人模仿学习提供简洁、规范的基准数据，推动基于视觉的操作策略研究，并验证数据驱动方法在物理机器人上的迁移能力。

当前挑战

该数据集所应对的核心领域挑战在于机器人操作中基础但关键的“抓取-放置”任务，其难点包括物体位姿估计的精度、手眼协调的动态稳定性，以及从人类演示中高效泛化至未见物体与环境的能力。构建过程中，数据集面临多重实际约束：首先，需确保遥操作系统的低延迟与高保真度，以采集到自然、流畅的专家轨迹；其次，同步多模态数据流（图像、状态、动作）在60 FPS下存在时钟校准与缺失帧处理的难题；此外，仅包含单一任务与50个片段的数据规模，对噪声鲁棒性与策略的过拟合控制提出了特殊要求，限制了其在复杂场景下的直接应用潜力。

常用场景

经典使用场景

test_pick_place_arx_lerobot_v3数据集是面向机器人拾取与放置（Pick-and-Place）任务精心构建的基准资源。在机器人操作领域中，拾取与放置是最基础且最具代表性的技能之一，该数据集通过Arx机器人平台采集，包含50个示范轨迹、总计11779帧的高频运动与视觉数据。研究者和开发者可利用其提供的7维状态向量、6维速度信息、7维动作指令以及左右视角与俯视角的高清视频序列，训练模仿学习或强化学习模型，使机器人学会从初始位置抓取目标物体并精确放置于指定位置。该数据集以LeRobot框架标准化格式存储，支持高效的训练-测试划分，是验证机器人操控算法性能的理想平台。

实际应用

在工业与服务业自动化场景中，该数据集可用于赋能智能机械臂执行仓库分拣、精密装配或家庭服务等典型任务。例如，物流企业可基于数据集训练出的策略，让机器人自动检测传送带上的物品、调整夹爪姿态并放置到对应料箱，从而大幅提升分拣效率。在医疗辅助领域，经过微调的模型能协助机器人完成手术器械的无菌传递或实验室试剂的精准摆放。此外，该数据集对多视角视觉输入的重视，使得部署于复杂背景环境下的机器人能够维持稳定的操作性能，例如在光照变化或遮挡条件下的动态拾取，这为工业4.0中柔性生产线的自适应调度提供了技术支撑。

衍生相关工作

基于该数据集的结构化特性，研究者已衍生出多项具有影响力的经典工作。例如，利用其多模态观测与高频动作标签，可改进扩散策略（Diffusion Policy）中的时间序列生成质量，通过对比不同观测组合（如仅使用左视图或俯视图）对成功率的影响。另一项典型工作是将其作为预训练数据集，用于微调视觉-语言-动作模型（如RT-2），验证机器人从模拟环境到真实世界的零样本迁移能力。该数据集还与LeRobot生态中的其他拾取任务数据联合，推动了跨物体、跨场景的通用操控技能学习框架的发展，其标准化格式更成为评测不同算法在外观与物理属性变化下鲁棒性的重要工具，进而催生了关于模仿学习数据效率与策略可扩展性的系统性研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集