five

so101_pickup_task

收藏
Hugging Face2025-07-25 更新2025-07-26 收录
下载链接:
https://huggingface.co/datasets/dunhao/so101_pickup_task
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集使用LeRobot创建,用于机器人学相关任务。它包含50个视频片段,共计28363帧,分为1个任务。数据集的结构包括动作、观察状态、前视图像、时间戳、帧索引、片段索引、任务索引等特征。所有数据以Apache-2.0许可证授权。
创建时间:
2025-07-23
原始信息汇总

数据集概述

基本信息

  • 许可证: apache-2.0
  • 任务类别: robotics
  • 标签: LeRobot
  • 配置:
    • 默认配置数据文件路径: data/*/*.parquet

数据集描述

  • 创建工具: LeRobot
  • 主页: [More Information Needed]
  • 论文: [More Information Needed]

数据集结构

  • 代码库版本: v2.1
  • 机器人类型: so101_follower
  • 总集数: 50
  • 总帧数: 28363
  • 总任务数: 1
  • 总视频数: 50
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 30 fps
  • 分割:
    • 训练集: 0:50
  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

  • 动作 (action):
    • 数据类型: float32
    • 形状: [6]
    • 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
  • 观察状态 (observation.state):
    • 数据类型: float32
    • 形状: [6]
    • 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
  • 观察图像 (observation.images.front):
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 名称: height, width, channels
    • 视频信息:
      • 高度: 480
      • 宽度: 640
      • 编解码器: av1
      • 像素格式: yuv420p
      • 是否为深度图: false
      • 帧率: 30 fps
      • 通道数: 3
      • 是否有音频: false
  • 时间戳 (timestamp):
    • 数据类型: float32
    • 形状: [1]
  • 帧索引 (frame_index):
    • 数据类型: int64
    • 形状: [1]
  • 集索引 (episode_index):
    • 数据类型: int64
    • 形状: [1]
  • 索引 (index):
    • 数据类型: int64
    • 形状: [1]
  • 任务索引 (task_index):
    • 数据类型: int64
    • 形状: [1]

引用

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作任务研究领域,so101_pickup_task数据集通过LeRobot框架系统性地采集了机械臂操作数据。该数据集包含50个完整操作序列,共计28363帧30fps的同步视频与状态数据,采用分块存储策略将数据组织为1000帧单位的parquet文件。数据采集过程完整记录了SO101型机械臂的6自由度关节状态、前端摄像头视觉信息及时间戳等多元模态数据,为机器人学习提供了结构化时空对齐的多维观测空间。
特点
该数据集最显著的特点是实现了机械臂控制信号与视觉观测的精确同步,每个数据点包含6维关节角度动作指令和480×640分辨率的RGB视觉帧。数据架构采用层次化设计,通过episode_index和frame_index实现跨模态数据的精确索引,且所有数值特征均以float32格式标准化存储。特别值得注意的是,动作空间与观测空间的关节状态采用同构表示,这种对称性设计有利于模仿学习算法的实现。
使用方法
研究者可通过解析parquet文件中的结构化字段获取时空对齐的多模态数据流,其中observation.images.front字段包含视频帧的存储路径,而action和observation.state字段分别对应机械臂的控制指令和实际状态。数据集已预分为训练集(全部50个序列),建议使用时配合LeRobot提供的工具链进行数据加载与可视化。对于模仿学习任务,可直接利用动作-状态对构建监督信号;强化学习研究则可基于时间戳字段重建完整的状态转移轨迹。
背景与挑战
背景概述
so101_pickup_task数据集是由LeRobot团队开发的机器人操作任务数据集,专注于机械臂抓取任务的实时控制与状态观测。该数据集通过集成多模态传感器数据,包括关节位置状态、视觉观测和时间序列信息,为机器人学习领域提供了丰富的训练资源。数据集包含50个完整操作序列,共计28363帧高精度控制数据,采用30fps的同步采样频率,精确记录了SO101型机械臂执行抓取任务时的动态响应过程。
当前挑战
该数据集面临的核心挑战主要体现在两个方面:在领域问题层面,机械臂的精确抓取控制需要解决高维连续动作空间与复杂物体交互的建模难题,现有方法在实时性与泛化能力上仍存在显著差距;在构建过程层面,多模态数据的时间同步、传感器标定精度以及大规模操作序列的标注质量都对数据集的可靠性提出了严峻考验。机械臂末端执行器的位姿估计误差与视觉观测的视角局限性进一步增加了数据采集的复杂度。
常用场景
经典使用场景
在机器人控制领域,so101_pickup_task数据集主要用于训练和评估机械臂抓取任务的算法性能。其包含的50个完整抓取任务视频序列及对应的关节位置数据,为研究者提供了丰富的机器人运动轨迹样本。数据集以30fps的高帧率记录了机械臂6个自由度的运动状态,特别适合用于研究连续动作空间下的控制策略优化问题。
衍生相关工作
基于该数据集衍生的研究主要集中于机器人强化学习领域,包括但不限于:基于视觉的端到端抓取策略学习、多模态传感器数据融合方法、以及模仿学习中的动作分割技术。部分工作进一步扩展了数据集的标注信息,开发了针对机械臂轨迹预测的注意力机制模型,推动了机器人控制算法的可解释性研究。
数据集最近研究
最新研究方向
在机器人操作任务领域,so101_pickup_task数据集因其包含的机械臂关节位置数据和视觉观测信息,正成为模仿学习与强化学习算法研究的热点。该数据集通过LeRobot平台采集,记录了SO101型机械臂执行抓取任务时的多模态数据,包括6自由度关节空间轨迹和480p RGB视频流,为研究端到端机器人控制策略提供了宝贵资源。近期研究聚焦于如何利用此类多模态数据提升模型在动态环境中的泛化能力,特别是在少样本学习场景下,结合视觉与运动学信息的跨模态表示学习成为关键突破方向。随着具身智能概念的兴起,该数据集在模拟真实世界物理交互方面的价值日益凸显,为机器人自主决策系统的开发提供了重要基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作