so101_pick_spell

Hugging Face2026-05-01 更新2026-05-02 收录

下载链接：

https://huggingface.co/datasets/gherrera-22/so101_pick_spell

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人技术数据集，采用Apache-2.0许可协议。数据集包含机器人手臂运动的相关数据，存储为parquet格式文件。数据集结构信息显示：代码库版本为v3.0，机器人类型为so_follower，包含1个任务片段、2584帧数据，视频帧率为30fps。数据文件总大小为100MB，视频文件为200MB。特征数据包括6个关节位置的动作和状态观测（肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置），以及时间戳、帧索引、片段索引等辅助信息。该数据集适用于机器人运动控制、行为模仿等研究任务。

创建时间：

2026-04-29

原始信息汇总

根据您提供的数据集详情页面信息，以下是该数据集的概述：

数据集概要

数据集名称：so101_pick_spell

许可证：Apache-2.0

任务类别：机器人学（robotics）

创建工具：该数据集使用 LeRobot 创建。

数据集结构

代码库版本：v3.0
机器人类型：so_follower
总片段数：1
总帧数：2584
总任务数：1
块大小：1000
数据文件大小：100 MB
视频文件大小：200 MB
帧率：30 fps
数据划分：仅包含训练集（train: 0:1）

数据特征

数据集包含以下特征字段：

字段	数据类型	形状	描述
action	float32	[6]	包含6个关节位置：shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
observation.state	float32	[6]	与action相同的6个关节位置观测值
timestamp	float32	[1]	时间戳
frame_index	int64	[1]	帧索引
episode_index	int64	[1]	片段索引
index	int64	[1]	整体索引
task_index	int64	[1]	任务索引

数据存储路径

数据文件路径：data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径：videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

其他信息

主页：待补充
论文：待补充
引用格式：待补充

搜集汇总

数据集介绍

构建方式

so101_pick_spell 数据集基于 LeRobot 框架构建，专为机器人操控任务设计。数据采集自 so_follower 机器人，涵盖单一操作任务，包含 1 个完整 episode，总计 2584 帧样本，以 30 FPS 帧率采集。数据以 Parquet 格式存储于分块文件中，视频数据则独立编码为 MP4 格式，确保高效存取。特征空间包括 6 维动作数据（肩部、肘部、腕部及夹爪位置）及对应的观测状态，时间戳和索引信息被完整记录，便于序列化建模。数据集采用 Apache-2.0 许可，支持灵活的复现与扩展。

使用方法

使用该数据集时，可借助 LeRobot 库的标准化接口进行加载与预处理。用户需基于 Hugging Face Spaces 的可视化工具预览数据，并通过指定 Parquet 分块路径读取动作与状态序列。推荐将 6 维动作向量作为监督信号，结合观测状态进行策略网络训练。数据以帧索引为基准对齐，支持构建固定长度的时间窗口（如 1000 帧的 chunk 划分），适合用于序列决策模型。由于仅包含训练集，可直接用于端到端的学习范式，无需额外划分验证或测试集。

背景与挑战

背景概述

so101_pick_spell数据集由研究团队利用LeRobot框架构建，专注于机器人操作领域的模仿学习研究。该数据集于近期发布，采用Apache-2.0许可证，旨在通过记录SO-100系列协作机器人（so_follower）执行拾取与拼写任务时的动作序列与状态信息，为机器人技能习得提供标准化的训练资源。数据集包含单一任务、2584帧连续帧和30帧/秒的采集频率，累计数据规模达300MB，核心特征涵盖六自由度关节位置（肩部、肘部、腕部及夹爪）的动作指令与观测状态。作为机器人行为克隆与强化学习的基础数据源，该数据集填补了小型协作机器人精细操作任务的公开数据空白，对推动端到端机器人学习算法的发展具有示范意义。

当前挑战

该数据集所面临的挑战首先体现于领域问题层面：机器人精细操作任务（如精确拾取与拼写）要求模型从高维连续动作空间中学习复杂的时序依赖关系，而单任务、少样本的配置（仅1个片段）难以支撑泛化性训练。构建过程中亦存在显著困难：数据采集依赖人工遥操作或示教，动作精度受硬件误差与环境干扰影响；同时，6维动作空间与视觉信息未在特征中显式编码，限制了多模态融合学习的可能性。此外，样本量过小（总帧数2584）导致模型易过拟合，缺乏任务多样性也阻碍了鲁棒策略的迁移能力。

常用场景

经典使用场景

在机器人学习与灵巧操作领域，so101_pick_spell数据集以精细化的机械臂运动轨迹为特色，其经典使用场景聚焦于模仿学习中的‘抓取-放置’任务。数据集依托SO-100系列六自由度机器人平台，以30帧/秒的高采样频率记录了累计2584帧的连续运动序列，涵盖肩关节、肘关节、腕关节及夹爪末端执行器的完整状态-动作配对。研究者可借助该数据构建行为克隆（Behavior Cloning）或逆强化学习（Inverse Reinforcement Learning）模型，使机器人通过观察示教轨迹，复现从空间定位到目标物件拾取并精确投放的复杂动素序列，尤其适用于验证多关节协同控制策略在离散操作任务中的迁移效能。

解决学术问题

该数据集系统性地回应了机器人技能获取过程中‘小样本泛化性’与‘运动基元解耦’两大核心学术难题。通过提供单一任务下的完整闭环演示轨迹，研究者得以探索在有限示教样本条件下，如何利用时序卷积网络或Transformer架构提取跨关节的运动协同模式，从而摆脱传统强化学习对海量环境交互的依赖。此外，数据集中状态与动作空间的严格对齐设计，为研究‘视觉-运动耦合’中的状态表征学习提供了标准对照基准，推动了解耦式逆动态模型在轻量级机器人系统上的发展，对理解机器人操作的‘符号落地问题’具有重要的理论桥梁意义。

实际应用

从工业精密装配到服务型抓取操作，so101_pick_spell数据集为低成本灵巧机器人落地提供了经过验证的运动基元库。在实际部署中，该数据集训练的模型可适配至SO-100系列衍生的多型号协作机械臂，实现电子元件分拣、实验室微量器具转移或柔性生产线物料上料等标准化作业。尤其在制药与检测领域，机器人可依据示教轨迹完成微量液体容器拾取与封盖操作，将人工操作中的手眼协调经验转化为可重复的机械指令，显著降低因疲劳导致的操作误差率。此种基于示范学习的部署范式，使得非编程人员亦能通过拖拽示教快速更新机器人技能，契合了制造业‘多品种、小批量’生产模式对灵活性的迫切需求。

数据集最近研究