so101_pick_spell
收藏Hugging Face2026-05-01 更新2026-05-02 收录
下载链接:
https://huggingface.co/datasets/gherrera-22/so101_pick_spell
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的机器人技术数据集,采用Apache-2.0许可协议。数据集包含机器人手臂运动的相关数据,存储为parquet格式文件。数据集结构信息显示:代码库版本为v3.0,机器人类型为so_follower,包含1个任务片段、2584帧数据,视频帧率为30fps。数据文件总大小为100MB,视频文件为200MB。特征数据包括6个关节位置的动作和状态观测(肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置),以及时间戳、帧索引、片段索引等辅助信息。该数据集适用于机器人运动控制、行为模仿等研究任务。
创建时间:
2026-04-29
原始信息汇总
根据您提供的数据集详情页面信息,以下是该数据集的概述:
数据集概要
数据集名称:so101_pick_spell
许可证:Apache-2.0
任务类别:机器人学(robotics)
创建工具:该数据集使用 LeRobot 创建。
数据集结构
- 代码库版本:v3.0
- 机器人类型:so_follower
- 总片段数:1
- 总帧数:2584
- 总任务数:1
- 块大小:1000
- 数据文件大小:100 MB
- 视频文件大小:200 MB
- 帧率:30 fps
- 数据划分:仅包含训练集(train: 0:1)
数据特征
数据集包含以下特征字段:
| 字段 | 数据类型 | 形状 | 描述 |
|---|---|---|---|
| action | float32 | [6] | 包含6个关节位置:shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos |
| observation.state | float32 | [6] | 与action相同的6个关节位置观测值 |
| timestamp | float32 | [1] | 时间戳 |
| frame_index | int64 | [1] | 帧索引 |
| episode_index | int64 | [1] | 片段索引 |
| index | int64 | [1] | 整体索引 |
| task_index | int64 | [1] | 任务索引 |
数据存储路径
- 数据文件路径:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
其他信息
- 主页:待补充
- 论文:待补充
- 引用格式:待补充
搜集汇总
数据集介绍

构建方式
so101_pick_spell 数据集基于 LeRobot 框架构建,专为机器人操控任务设计。数据采集自 so_follower 机器人,涵盖单一操作任务,包含 1 个完整 episode,总计 2584 帧样本,以 30 FPS 帧率采集。数据以 Parquet 格式存储于分块文件中,视频数据则独立编码为 MP4 格式,确保高效存取。特征空间包括 6 维动作数据(肩部、肘部、腕部及夹爪位置)及对应的观测状态,时间戳和索引信息被完整记录,便于序列化建模。数据集采用 Apache-2.0 许可,支持灵活的复现与扩展。
使用方法
使用该数据集时,可借助 LeRobot 库的标准化接口进行加载与预处理。用户需基于 Hugging Face Spaces 的可视化工具预览数据,并通过指定 Parquet 分块路径读取动作与状态序列。推荐将 6 维动作向量作为监督信号,结合观测状态进行策略网络训练。数据以帧索引为基准对齐,支持构建固定长度的时间窗口(如 1000 帧的 chunk 划分),适合用于序列决策模型。由于仅包含训练集,可直接用于端到端的学习范式,无需额外划分验证或测试集。
背景与挑战
背景概述
so101_pick_spell数据集由研究团队利用LeRobot框架构建,专注于机器人操作领域的模仿学习研究。该数据集于近期发布,采用Apache-2.0许可证,旨在通过记录SO-100系列协作机器人(so_follower)执行拾取与拼写任务时的动作序列与状态信息,为机器人技能习得提供标准化的训练资源。数据集包含单一任务、2584帧连续帧和30帧/秒的采集频率,累计数据规模达300MB,核心特征涵盖六自由度关节位置(肩部、肘部、腕部及夹爪)的动作指令与观测状态。作为机器人行为克隆与强化学习的基础数据源,该数据集填补了小型协作机器人精细操作任务的公开数据空白,对推动端到端机器人学习算法的发展具有示范意义。
当前挑战
该数据集所面临的挑战首先体现于领域问题层面:机器人精细操作任务(如精确拾取与拼写)要求模型从高维连续动作空间中学习复杂的时序依赖关系,而单任务、少样本的配置(仅1个片段)难以支撑泛化性训练。构建过程中亦存在显著困难:数据采集依赖人工遥操作或示教,动作精度受硬件误差与环境干扰影响;同时,6维动作空间与视觉信息未在特征中显式编码,限制了多模态融合学习的可能性。此外,样本量过小(总帧数2584)导致模型易过拟合,缺乏任务多样性也阻碍了鲁棒策略的迁移能力。
常用场景
经典使用场景
在机器人学习与灵巧操作领域,so101_pick_spell数据集以精细化的机械臂运动轨迹为特色,其经典使用场景聚焦于模仿学习中的‘抓取-放置’任务。数据集依托SO-100系列六自由度机器人平台,以30帧/秒的高采样频率记录了累计2584帧的连续运动序列,涵盖肩关节、肘关节、腕关节及夹爪末端执行器的完整状态-动作配对。研究者可借助该数据构建行为克隆(Behavior Cloning)或逆强化学习(Inverse Reinforcement Learning)模型,使机器人通过观察示教轨迹,复现从空间定位到目标物件拾取并精确投放的复杂动素序列,尤其适用于验证多关节协同控制策略在离散操作任务中的迁移效能。
解决学术问题
该数据集系统性地回应了机器人技能获取过程中‘小样本泛化性’与‘运动基元解耦’两大核心学术难题。通过提供单一任务下的完整闭环演示轨迹,研究者得以探索在有限示教样本条件下,如何利用时序卷积网络或Transformer架构提取跨关节的运动协同模式,从而摆脱传统强化学习对海量环境交互的依赖。此外,数据集中状态与动作空间的严格对齐设计,为研究‘视觉-运动耦合’中的状态表征学习提供了标准对照基准,推动了解耦式逆动态模型在轻量级机器人系统上的发展,对理解机器人操作的‘符号落地问题’具有重要的理论桥梁意义。
实际应用
从工业精密装配到服务型抓取操作,so101_pick_spell数据集为低成本灵巧机器人落地提供了经过验证的运动基元库。在实际部署中,该数据集训练的模型可适配至SO-100系列衍生的多型号协作机械臂,实现电子元件分拣、实验室微量器具转移或柔性生产线物料上料等标准化作业。尤其在制药与检测领域,机器人可依据示教轨迹完成微量液体容器拾取与封盖操作,将人工操作中的手眼协调经验转化为可重复的机械指令,显著降低因疲劳导致的操作误差率。此种基于示范学习的部署范式,使得非编程人员亦能通过拖拽示教快速更新机器人技能,契合了制造业‘多品种、小批量’生产模式对灵活性的迫切需求。
数据集最近研究
最新研究方向
在机器人学习领域,so101_pick_spell数据集聚焦于灵巧操控的精细动作模仿,其六自由度关节状态与动作的完整刻画,为基于视觉-运动联合的机器人技能迁移研究提供了低维但高保真的数据基础。当前该方向的前沿热点集中在利用少量示范进行高效的行为克隆与元学习,该数据集以单任务、密集时序的轨迹形式,恰好契合了从静态示教到动态泛化的范式转变。其公开的LeRobot标准化格式,更推动了开放环境中机器人操控策略的可复现性研究,对于探索机械臂在制造业自动化和服务场景中的自适应抓取与拼装任务具有启发性意义。
以上内容由遇见数据集搜集并总结生成



