five

so101_med

收藏
Hugging Face2025-07-21 更新2025-07-22 收录
下载链接:
https://huggingface.co/datasets/wangranryan/so101_med
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个针对机器人任务的数据集,特别是针对类型为'so101_follower'的机器人。数据集包含了多个剧集、帧和视频,以及多种观察和动作特征,这表明它适用于机器人模拟或研究。数据集遵循Apache-2.0许可。
创建时间:
2025-07-17
原始信息汇总

数据集概述

基本信息

  • 许可证: apache-2.0
  • 任务类别: robotics
  • 标签: LeRobot
  • 创建工具: LeRobot

数据集结构

  • 数据文件格式: parquet
  • 配置名称: default
  • 数据文件路径: data//.parquet

元数据信息

  • 代码库版本: v2.1
  • 机器人类型: so101_follower
  • 总集数: 10
  • 总帧数: 2063
  • 总任务数: 1
  • 总视频数: 20
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 30 fps
  • 训练集划分: 0:10

数据特征

  • 动作 (action):
    • 数据类型: float32
    • 形状: [6]
    • 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
  • 观测状态 (observation.state):
    • 数据类型: float32
    • 形状: [6]
    • 名称: 同动作特征
  • 固定图像观测 (observation.images.fixed):
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 视频信息: 高度480, 宽度640, 编码av1, 像素格式yuv420p, 非深度图, 帧率30, 通道3, 无音频
  • 手眼图像观测 (observation.images.hand_eye):
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 视频信息: 同固定图像观测
  • 时间戳 (timestamp):
    • 数据类型: float32
    • 形状: [1]
  • 帧索引 (frame_index):
    • 数据类型: int64
    • 形状: [1]
  • 集索引 (episode_index):
    • 数据类型: int64
    • 形状: [1]
  • 索引 (index):
    • 数据类型: int64
    • 形状: [1]
  • 任务索引 (task_index):
    • 数据类型: int64
    • 形状: [1]

引用信息

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,so101_med数据集的构建采用了LeRobot框架进行系统化采集与处理。该数据集通过记录10个完整任务周期,共2063帧数据,以30fps的帧率捕获机械臂的六维关节位置信息及双视角视觉数据。数据存储采用分块式结构,每个数据块包含1000帧,并以Parquet格式高效存储,视频流则使用AV1编码压缩,确保数据完整性的同时优化存储效率。
特点
该数据集的核心价值体现在多模态数据的深度融合,不仅包含机械臂六自由度关节的精确位置反馈(shoulder_pan至gripper),还同步采集固定视角与手眼相机的480p RGB视频流。所有动作与观测数据均以float32精度保存,时间戳与帧索引的精确对应为时序分析提供保障。独特的数据结构设计允许研究者灵活调用单帧或连续帧序列,满足不同粒度的算法验证需求。
使用方法
研究者可通过解析Parquet文件获取结构化动作与状态数据,配合MP4格式视频文件进行多模态对齐分析。数据集已预置训练集划分(0:10),建议使用LeRobot框架内置工具加载数据流。对于关节控制研究,可直接调用action特征空间;计算机视觉任务则可利用observation.images下的双视角视频流,其标准化的480x640分辨率与YUV420P像素格式确保跨平台兼容性。
背景与挑战
背景概述
so101_med数据集由HuggingFace旗下的LeRobot项目团队创建,专注于机器人技术领域的研究与应用。该数据集旨在为机器人跟随任务提供丰富的多模态数据支持,包含机械臂关节位置、视觉观测等多种传感器信息。数据集采用Apache-2.0开源协议,其核心价值在于为机器人控制算法的训练与验证提供真实场景下的高质量数据。通过10个完整任务序列和2063帧的多维度数据记录,该数据集为机器人行为学习与状态估计等研究方向提供了重要基准。
当前挑战
该数据集面临的主要挑战体现在两个方面:在领域问题层面,机器人跟随任务需要解决复杂环境下的实时感知与精准控制问题,如何从多模态数据中提取有效特征并实现鲁棒的行为决策是核心难点;在构建过程层面,数据采集涉及机械臂运动控制与视觉系统的精确同步,确保不同传感器数据的时间对齐与空间标定具有较高技术难度。此外,大规模视频数据的压缩存储与高效检索也对数据集架构设计提出了严格要求。
常用场景
经典使用场景
在机器人控制领域,so101_med数据集为研究者提供了一个标准化的实验平台,用于开发和测试机械臂的运动控制算法。该数据集包含机械臂的关节位置、图像观测以及时间戳等信息,特别适用于模仿学习和强化学习算法的训练与验证。通过该数据集,研究者能够模拟真实环境中的机械臂操作任务,从而优化控制策略。
实际应用
在实际应用中,so101_med数据集可被用于工业自动化中的机械臂控制任务,例如装配、分拣和搬运。通过该数据集训练的算法能够提升机械臂的操作精度和效率,从而优化生产流程。此外,该数据集还可用于医疗机器人领域,辅助开发更精准的手术机器人控制系统。
衍生相关工作
基于so101_med数据集,研究者已开展多项经典工作,包括机械臂的模仿学习算法优化、多任务强化学习框架设计以及视觉-运动联合建模。这些工作不仅提升了机械臂的自主操作能力,还为机器人控制领域的后续研究奠定了重要基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作