five

soarm101_pickplace_6d_240e_fw_closed

收藏
Hugging Face2026-02-23 更新2026-02-24 收录
下载链接:
https://huggingface.co/datasets/edgarcancinoe/soarm101_pickplace_6d_240e_fw_closed
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,专为机器人技术领域设计。数据集采用apache-2.0许可证,包含240个episodes和180027帧数据,全部用于训练。数据集结构包括动作、观测(状态和图像)、时间戳、帧索引、episode索引、任务索引和关节位置等多种数据类型。具体来说,动作和观测状态包含10个浮点数值,分别代表x、y、z坐标、6D旋转和夹爪状态。观测图像包括顶部和腕部视角,分辨率为480x640,3通道,视频编码为av1,帧率为30fps。关节位置数据包含6个浮点数值,分别对应不同关节的位置。数据以parquet文件格式存储,视频文件以mp4格式存储。

This dataset was developed using LeRobot, and is specifically designed for the robotics domain. It is licensed under Apache-2.0, containing 240 episodes and 180,027 frames of data, all intended for model training. The dataset encompasses multiple data types including actions, observations (state and images), timestamps, frame indices, episode indices, task indices, and joint positions. Specifically, both actions and observation states comprise 10 floating-point values, which respectively represent x, y, z coordinates, 6D rotation, and gripper status. The observation images cover top-down and wrist-mounted viewpoints, with a resolution of 480×640, 3 channels, encoded in AV1 video format, at a frame rate of 30 fps. The joint position data consists of 6 floating-point values corresponding to the positions of individual robotic joints. The data is stored in Parquet file format, while the video files are saved in MP4 format.
创建时间:
2026-02-23
搜集汇总
数据集介绍
构建方式
在机器人操作领域,soarm101_pickplace_6d_240e_fw_closed数据集依托LeRobot平台构建,专注于抓取放置任务的六维空间操作。该数据集通过so100_follower型机器人执行单一任务,采集了240个完整操作片段,总计180,027帧数据,以30帧每秒的速率记录。数据以分块形式存储于Parquet文件中,每块包含1000帧,确保了高效的数据管理与访问。构建过程中同步录制了顶部与腕部视角的视频,采用AV1编码,分辨率达640x480,为视觉感知研究提供了丰富的多模态信息。
特点
该数据集的特点在于其多维度的数据表征与精细的结构化设计。动作与状态空间均以10维浮点向量描述,涵盖末端执行器的三维位置、六维旋转姿态以及夹爪状态,同时提供了6维关节位置作为补充。观测数据融合了双视角RGB视频流,增强了环境感知的全面性。数据集采用分块存储策略,总数据量约300MB,便于分布式处理与加载。所有数据均附带时间戳、帧索引与片段索引,支持精确的时间序列分析与任务建模,为机器人模仿学习与策略优化提供了标准化的基准。
使用方法
使用该数据集时,研究者可通过LeRobot框架或兼容的数据加载工具访问Parquet格式的文件。数据按片段与分块组织,路径遵循`data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet`的命名规范,便于程序化遍历。视频文件独立存储于`videos/`目录下,与动作及状态数据同步对应。典型应用包括端到端策略训练、行为克隆或强化学习,用户可结合观测图像、关节状态与末端动作进行模型训练。数据集已预设训练集划分,涵盖全部240个片段,适用于开箱即用的实验部署与算法验证。
背景与挑战
背景概述
在机器人操作领域,模仿学习作为实现复杂任务自主执行的关键途径,其性能高度依赖于高质量、大规模的真实世界交互数据。soarm101_pickplace_6d_240e_fw_closed数据集应运而生,它由HuggingFace的LeRobot项目创建,专门针对六自由度机械臂的抓取与放置任务。该数据集收录了240个完整操作序列,包含超过18万帧的多模态观测数据,如顶部与腕部摄像头视频、关节位置以及精确的末端执行器位姿与抓取器状态。其核心研究问题聚焦于如何利用真实机器人交互数据,训练出能够在非结构化环境中鲁棒完成精细操作任务的策略模型,为推动机器人从演示中学习的研究提供了宝贵的实证基础。
当前挑战
该数据集旨在应对机器人模仿学习中策略泛化与真实世界部署的挑战。具体而言,其解决的领域问题是如何让机械臂在六自由度空间内,仅凭视觉与状态观测,就能泛化地完成多样化的抓放操作,这要求模型必须理解复杂的空间几何关系与连续动作序列。在构建过程中,挑战同样显著:需要精确同步多路高帧率视频流与机器人本体状态数据,确保时序对齐;采集大规模真实交互数据本身耗时费力,且需保证操作轨迹的多样性与任务成功率;此外,数据的高维度与异构性(如图像、状态、动作)对存储、预处理及后续算法设计都提出了较高要求。
常用场景
经典使用场景
在机器人操作领域,该数据集为六自由度机械臂的抓取与放置任务提供了丰富的演示数据。其核心应用场景在于训练端到端的模仿学习模型,通过整合来自顶部和腕部摄像头的视觉观测、关节位置状态以及精确的六维旋转表示动作,模型能够学习从感知到动作的映射策略,从而在复杂环境中实现精准的物体操控。
解决学术问题
该数据集有效应对了机器人模仿学习中数据稀缺与动作表示复杂性的挑战。它通过提供大规模、多模态的演示轨迹,为研究连续控制策略、视觉运动规划以及六维姿态估计等关键问题奠定了数据基础。其采用旋转六维向量(rot6d)进行姿态编码,避免了传统欧拉角或四元数表示中的奇异性问题,提升了动作空间的平滑性与学习稳定性,对推动数据驱动的机器人技能获取研究具有显著意义。
衍生相关工作
围绕此类机器人操作数据集,学术界衍生出诸多经典研究方向。例如,基于行为克隆(BC)与离线强化学习(Offline RL)的策略学习方法,旨在从演示数据中提取鲁棒且泛化性强的策略。同时,视觉表征学习、多任务学习以及涉及动作预测与状态重建的自监督学习框架也常以此类数据为基准进行验证与改进,不断推动着机器人智能从实验室向现实世界迈进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作