soarm101_pickplace_multicolor_v1

Hugging Face2026-04-13 更新2026-04-14 收录

下载链接：

https://huggingface.co/datasets/edgarcancinoe/soarm101_pickplace_multicolor_v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人技术相关的数据集，使用LeRobot创建，采用Apache-2.0许可证。数据集包含30个episodes，共27724帧，涉及2个任务。数据以parquet文件格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构包括多个特征字段，如动作（action）、观察状态（observation.state）、主次摄像头图像（observation.images.main/secondary）、时间戳（timestamp）、帧索引（frame_index）、episode索引（episode_index）、任务索引（task_index）、关节位置（observation.joint_positions）和关节动作（action_joints）。这些字段详细描述了机器人的状态和动作，适用于机器人控制、行为学习等任务。

创建时间：

2026-04-11

原始信息汇总

数据集概述

基本信息

数据集名称: soarm101_pickplace_multicolor_v1
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集规模与结构

总情节数: 30
总帧数: 27724
总任务数: 2
数据块大小: 1000
数据文件大小: 100 MB
视频文件大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (0:30)
代码库版本: v3.0
机器人类型: so100_follower

数据文件与路径

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作特征

action: 浮点32数组，形状[10]，包含x, y, z, rot6d_0, rot6d_1, rot6d_2, rot6d_3, rot6d_4, rot6d_5, gripper。
action_joints: 浮点32数组，形状[6]，包含shoulder_pan, shoulder_lift, elbow_flex, wrist_flex, wrist_roll, gripper。

观测特征

observation.state: 浮点32数组，形状[10]，包含x, y, z, rot6d_0, rot6d_1, rot6d_2, rot6d_3, rot6d_4, rot6d_5, gripper。
observation.images.main: 视频类型，形状[480, 640, 3]，包含高度、宽度、通道信息。视频高度480，宽度640，编码av1，像素格式yuv420p，非深度图，帧率30，通道数3，无音频。
observation.images.secondary: 视频类型，形状[480, 640, 3]，包含高度、宽度、通道信息。视频高度480，宽度640，编码av1，像素格式yuv420p，非深度图，帧率30，通道数3，无音频。
observation.joint_positions: 浮点32数组，形状[6]，包含shoulder_pan, shoulder_lift, elbow_flex, wrist_flex, wrist_roll, gripper。

索引与元数据特征

timestamp: 浮点32数组，形状[1]。
frame_index: 整型64数组，形状[1]。
episode_index: 整型64数组，形状[1]。
index: 整型64数组，形状[1]。
task_index: 整型64数组，形状[1]。

可视化

可视化地址: https://huggingface.co/spaces/lerobot/visualize_dataset?path=edgarcancinoe/soarm101_pickplace_multicolor_v1

引用信息

论文: 未提供
BibTeX引用: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于实际物理系统的交互记录。soarm101_pickplace_multicolor_v1数据集通过LeRobot平台，利用so100_follower型机器人执行拾放任务，系统采集了30个完整操作片段，总计27724帧数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，同时配有同步录制的双视角视频，帧率为30fps，视频编码采用AV1格式，确保了数据的高效压缩与清晰度。

使用方法

使用该数据集时，研究人员可通过LeRobot提供的工具链直接加载与可视化数据。数据集已预分为训练集，涵盖全部30个片段。每个数据样本包含时间戳、帧索引及任务索引等元数据，便于按需切片与对齐。模型训练可基于图像观测学习端到端的控制策略，或利用状态信息进行动力学建模。数据集采用Apache 2.0许可证，支持学术与商业用途的灵活开发。

背景与挑战

背景概述

在机器人操作领域，模仿学习与强化学习的研究依赖于高质量、多模态的真实世界数据集。soarm101_pickplace_multicolor_v1数据集由LeRobot团队构建，旨在为机器人抓取与放置任务提供丰富的视觉与动作数据。该数据集采集自so100_follower机器人平台，包含30个完整任务片段，涵盖多视角视频、关节状态与末端执行器动作，为开发通用机器人策略模型奠定了数据基础。其创建反映了当前机器人学对可扩展、多样化数据集的迫切需求，以推动从仿真到真实环境的迁移学习研究。

当前挑战

该数据集致力于解决机器人抓放操作中的视觉-动作映射挑战，尤其在多颜色物体识别与精准位姿控制方面存在复杂性。构建过程中面临数据同步与标注的困难，需确保多传感器信息（如双视角视频与关节编码器）的时间一致性。此外，真实环境下的物体多样性、光照变化与机械臂动力学噪声增加了数据采集的鲁棒性要求，而大规模视频存储与高效读取亦构成技术瓶颈。

常用场景

经典使用场景

在机器人操作领域，soarm101_pickplace_multicolor_v1数据集为视觉-动作映射研究提供了典型范例。该数据集记录了机器人执行拾取与放置任务的过程，包含多视角视频、关节位置及末端执行器动作等丰富信息。研究人员常利用此类数据训练深度强化学习模型，使机器人能够从视觉输入中推断出精确的动作指令，实现基于观察的自主操作。

解决学术问题

该数据集有效应对了机器人模仿学习中的数据稀缺挑战，为端到端策略学习提供了高质量的真实世界演示。它支持研究视觉特征提取、动作序列预测以及多模态数据融合等关键问题，促进了从演示中学习复杂操作技能的方法发展。通过提供结构化且标注详尽的轨迹数据，该数据集降低了机器人学习在非结构化环境中执行任务的门槛。

实际应用

在工业自动化和物流分拣场景中，该数据集所支撑的技术能够直接应用于物体抓取、分类摆放等流程。基于此类数据训练的模型可部署于装配线或仓库机器人，提升其处理多样化、多颜色物体的适应性和鲁棒性。这为柔性制造和智能仓储系统提供了核心算法验证基础，推动了机器人从固定编程向感知驱动操作的转型。

数据集最近研究