five

SO101_FMB_ACT_08

收藏
Hugging Face2025-09-06 更新2025-09-07 收录
下载链接:
https://huggingface.co/datasets/zacapa/SO101_FMB_ACT_08
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于机器人学的数据集,包含24个剧集,共13887帧,1个任务,48个视频和1个片段。数据集使用LeRobot创建,所有的数据文件均为.parquet格式。数据集的特征包括动作、观测状态、俯视图像、手腕图像、时间戳、帧索引、剧集索引、索引和任务索引等。
创建时间:
2025-09-04
原始信息汇总

数据集概述

基本信息

  • 名称: SO101_FMB_ACT_08
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot, robotics, so101, automation

数据集结构

  • 总任务数: 1
  • 总视频数: 48
  • 总片段数: 24
  • 总帧数: 13887
  • 数据块数: 1
  • 块大小: 1000
  • 帧率: 30 fps
  • 数据格式: Parquet
  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
  • 代码库版本: v2.1
  • 机器人类型: so101_follower
  • 分割: 训练集 (0:24)

特征描述

  • action: 浮点32类型,形状[6],包含肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置
  • observation.state: 浮点32类型,形状[6],包含与action相同的关节位置信息
  • observation.images.overhead: 视频类型,分辨率480x640x3,编码格式av1,无音频
  • observation.images.wrist: 视频类型,分辨率240x320x3,编码格式av1,无音频
  • timestamp: 浮点32类型,形状[1]
  • frame_index: 整型64类型,形状[1]
  • episode_index: 整型64类型,形状[1]
  • index: 整型64类型,形状[1]
  • task_index: 整型64类型,形状[1]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,SO101_FMB_ACT_08数据集通过LeRobot框架精心构建,涵盖了24个完整操作片段,总计13887帧数据。数据以Parquet格式存储,采用分块管理策略,每个数据块包含1000帧,确保了高效的数据存取与处理。数据采集过程中,机器人状态与动作信息被同步记录,形成了多模态数据集。
特点
该数据集显著特点在于其丰富的多模态数据结构,包含六维关节角度动作向量、双视角视觉观测(顶置与腕部摄像头)及精确的时间戳索引。顶置摄像头提供480x640分辨率视频,腕部视角则为240x320,均以30fps帧率采集,为机器人模仿学习提供了高精度时空对齐的多传感器数据源。
使用方法
研究人员可通过加载Parquet数据文件直接访问结构化数据,利用帧索引和片段索引进行时序分析。该数据集适用于机器人行为克隆、强化学习等任务,支持从原始视频流到关节动作的端到端模型训练。数据遵循Apache 2.0许可协议,可直接集成于主流机器学习框架进行开发。
背景与挑战
背景概述
机器人技术领域近年来在模仿学习与自主决策方面取得显著进展,SO101_FMB_ACT_08数据集作为LeRobot项目的重要组成部分,专注于机械臂操作任务的轨迹记录与行为克隆。该数据集通过SO101型跟随机器人采集了24个完整操作序列,包含13,887帧多模态传感器数据,涵盖了关节角度控制、视觉感知与时间同步等多维度信息。其构建旨在为机器人动作生成与状态预测提供高质量示范数据,推动工业自动化与服务机器人领域的算法创新。
当前挑战
该数据集核心挑战在于解决高维连续动作空间中的精确轨迹模仿问题,需克服机械臂运动学约束与视觉-动作映射的复杂性。构建过程中面临多传感器时序对齐的技术难点,包括 overhead 与 wrist 双视角视频流与关节状态数据的毫秒级同步。此外,6自由度机械臂的动作指令生成需保持物理可行性,而有限的任务多样性(仅1类任务)对泛化能力提出更高要求。
常用场景
经典使用场景
在机器人行为克隆研究中,SO101_FMB_ACT_08数据集通过记录六自由度机械臂的关节角度与双视角视觉数据,为模仿学习算法提供多模态训练样本。其包含的24个完整操作序列精准再现了工业场景中的物体抓取流程,研究者可基于该数据集构建从视觉感知到动作执行的端到端映射模型。
衍生相关工作
基于该数据集衍生了多项行为克隆领域的创新研究,包括基于时空注意力机制的多视角特征融合网络、结合逆动力学模型的示教学习框架。这些工作通过挖掘数据集中隐含的状态-动作对应关系,推动了视觉运动策略生成技术在柔性制造系统中的实际应用。
数据集最近研究
最新研究方向
在机器人操作学习领域,SO101_FMB_ACT_08数据集正推动多模态感知与强化学习的深度融合研究。该数据集通过提供高精度关节位置数据与双视角视觉信息,支持端到端模仿学习算法的开发,特别是在动态环境下的机械臂抓取任务中表现出显著价值。近年来,结合Transformer架构的多传感器融合方法成为热点,能够有效提升动作预测的准确性与泛化能力。该数据集的开放共享加速了家庭服务机器人智能化进程,为实现在非结构化环境中的自主操作提供了关键数据支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作