pick_and_place_small_objs_v2

Hugging Face2025-08-28 更新2025-08-29 收录

下载链接：

https://huggingface.co/datasets/torotocho/pick_and_place_small_objs_v2

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人的数据集，包含2个剧集，共3594帧，1个任务，没有视频文件，只有1个数据块，大小为1000。数据集的帧率为30fps，数据被分割为训练集。每个数据点包含机器人关节位置的动作和观测状态、前视图像、时间戳、帧索引、剧集索引、索引和任务索引等信息。

创建时间：

2025-08-28

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

总任务数: 1
总视频数: 0
总片段数: 1
片段大小: 1000
帧率: 30 FPS
数据格式: Parquet
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: 无

数据统计

总情节数: 2
总帧数: 3594
训练集划分: 0:2

特征描述

动作特征: 6维浮点数组，包含肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置
观测状态: 6维浮点数组，关节位置与动作特征相同
前视图像观测: 720×1280×3 RGB图像
时间戳: 单精度浮点数
帧索引: 64位整数
情节索引: 64位整数
全局索引: 64位整数
任务索引: 64位整数

技术信息

代码库版本: v2.1
机器人类型: so101_follower

引用信息

论文: 待补充
首页: 待补充
BibTeX引用: 待补充

搜集汇总

数据集介绍

构建方式

在机器人操作任务领域，数据集的构建方式直接影响模型训练的有效性。pick_and_place_small_objs_v2数据集通过LeRobot平台采集，采用高精度六轴机械臂（so101_follower型）执行小型物体抓取与放置任务，以30fps的频率记录多模态数据。数据以分块形式存储于Parquet文件中，共包含2个完整操作序列和3594帧数据，涵盖关节角度、图像观测及时间戳等关键信息。

特点

该数据集的核心特点在于其精细的多模态数据结构与机器人操作场景的高度适配性。动作空间包含六维连续关节控制指令，观测空间则整合了720p前端摄像头图像与同步关节状态反馈。数据帧级索引与任务索引的嵌套设计支持精确的时序分析，而统一的Apache 2.0许可协议确保了学术与工业应用的开放性。

使用方法

研究者可通过HuggingFace平台直接加载Parquet格式数据，利用帧索引实现操作序列的重构与可视化。该数据集适用于模仿学习与强化学习算法的训练，前端图像可作为视觉感知输入，关节状态与动作向量构成闭环控制信号。建议以分块加载方式处理大规模序列数据，并结合时间戳字段实现多传感器数据的精确对齐。

背景与挑战

背景概述

机器人操作领域近年来在深度学习推动下取得显著进展，pick_and_place_small_objs_v2数据集作为LeRobot项目的重要组成部分，专注于小型物体的精准抓取与放置任务。该数据集由HuggingFace团队基于Apache-2.0许可协议构建，采用so101_follower型机器人采集多模态数据，包含3594帧高分辨率视觉观测和6自由度机械臂动作记录，为模仿学习与强化学习算法提供了真实世界的训练基准。

当前挑战

该数据集致力于解决机器人精细操作中的视觉-运动协同挑战，包括小物体定位精度、抓取姿态优化和防碰撞控制等核心问题。在构建过程中面临多传感器时序同步、高维动作空间采样效率、以及真实环境光照变化干扰等技术难点，同时需确保数据采集过程的安全性与可重复性。

常用场景

经典使用场景

在机器人操作研究领域，pick_and_place_small_objs_v2数据集专为小型物体抓取与放置任务而设计。该数据集通过记录六自由度机械臂的关节位置、夹爪状态及前端视觉观测，为模仿学习算法提供多模态训练数据。研究者可利用该数据集训练端到端的控制策略，使机器人学会从视觉输入直接映射到关节运动指令，实现精准的物品转移操作。

解决学术问题

该数据集有效解决了机器人模仿学习中多模态感知与运动控制的耦合难题。通过提供同步的视觉观测和关节运动数据，它支持研究者开发能够理解场景语义并生成相应动作的智能系统。其重要意义在于推动了视觉-动作映射模型的进展，为解决现实世界中复杂操作任务提供了标准化评估基准，显著降低了机器人学习算法的验证门槛。

衍生相关工作

该数据集催生了多项机器人学习领域的创新研究。基于其多模态特性，研究者开发了融合视觉注意机制的仿人抓取网络，实现了更精准的物体定位与抓取。同时衍生出时空一致性学习框架，通过分析连续帧间的运动关联性提升动作生成的平滑度。这些工作进一步推动了行为克隆算法在复杂操作任务中的性能边界，为具身智能的发展提供了重要技术支撑。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集