place-cans

Hugging Face2025-10-26 更新2025-10-27 收录

下载链接：

https://huggingface.co/datasets/mklingen/place-cans

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于机器人任务的 datasets，包含60个剧集，共有56306帧。数据集分为训练集。每个数据文件包含1000个数据块，总大小为100MB，视频文件大小为500MB。数据集的特征包括动作位置、状态、前视图像等，并且每个特征都有详细的类型和形状信息。

创建时间：

2025-10-25

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot
创建工具: LeRobot

数据集结构

总任务数: 1
总回合数: 60
总帧数: 56306
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS
代码库版本: v3.0
机器人类型: so101_follower
数据块大小: 1000
数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作特征

数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测

数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

前视图像观测

数据类型: 视频
维度: [480, 640, 3]
视频属性:
- 高度: 480
- 宽度: 640
- 通道数: 3
- 帧率: 30
- 编解码器: av1
- 像素格式: yuv420p
- 深度图: 否
- 音频: 无

索引特征

时间戳: float32 [1]
帧索引: int64 [1]
回合索引: int64 [1]
索引: int64 [1]
任务索引: int64 [1]

数据划分

训练集: 0-60回合

搜集汇总

数据集介绍

构建方式

在机器人操作任务数据采集领域，place-cans数据集通过LeRobot平台系统构建，采用真实物理环境下的交互记录方式。该数据集包含60个完整任务片段，共计56306帧时序数据，以30Hz频率同步采集机械臂关节状态与视觉观测信息。数据以分块存储的Parquet格式组织，每个数据块包含1000帧结构化记录，确保高效存取与大规模时序关联性。

特点

该数据集呈现多维异构的机器人操作特征，集成六自由度机械臂的连续动作空间与480×640分辨率的前视RGB视频流。数据维度涵盖关节位置、夹爪状态等6维控制指令，同时提供精确的时间戳与帧索引标识。独特的并行数据流设计使动作指令与视觉观测保持严格同步，为模仿学习与行为克隆研究提供时空对齐的多模态基础。

使用方法

研究者可通过标准数据加载接口访问分块存储的Parquet文件，利用帧索引与片段标识实现精确数据定位。数据集支持端到端的策略学习流程，既能提取关节角度序列构建动作模型，也可结合前视图像训练感知控制网络。时序对齐特性允许开发基于状态的强化学习算法，或利用视觉观测实现传感器imitation learning任务。

背景与挑战

背景概述

在机器人操作任务研究领域，place-cans数据集作为LeRobot项目的重要组成部分，聚焦于机械臂物体摆放这一核心问题。该数据集通过记录六自由度机械臂的关节位置、夹持器状态及前视角视觉数据，构建了包含60个完整操作序列的示范数据。其结构化特征设计体现了机器人模仿学习领域对多模态数据融合的前沿探索，为研究从视觉观察到动作生成的端到端策略提供了关键实验基础。

当前挑战

该数据集致力于解决机器人精细操作中的动作规划与视觉感知协同挑战，具体体现在机械臂轨迹优化与环境适应性等维度。在构建过程中面临多传感器时序对齐的工程难题，包括30Hz视频流与关节状态数据的精确同步，以及高维动作空间下的示范质量保证。此外，深度视频编码与大规模示范数据存储的技术瓶颈亦构成显著挑战。

常用场景

经典使用场景

在机器人操作学习领域，place-cans数据集通过记录机械臂执行物体放置任务的完整轨迹，为模仿学习算法提供了丰富的训练样本。该数据集包含60个完整操作序列，涵盖关节位置、视觉观察与时间戳等多模态数据，能够有效支持端到端策略网络的训练与验证。其结构化特征设计使得研究人员能够直接提取状态-动作映射关系，为机器人精细操作任务的算法开发奠定基础。

衍生相关工作

该数据集已催生系列基于深度强化学习的机器人操作研究，特别是在视觉-动作联合建模方向取得显著进展。以LeRobot框架为代表的衍生工作，通过融合时空特征提取与策略优化，实现了从原始像素到关节控制的端到端学习。这些研究不仅验证了数据集中多模态信息的有效性，更为后续的元学习、跨任务迁移等前沿方向提供了基准测试平台。

数据集最近研究