five

so101_test_2

收藏
Hugging Face2025-06-05 更新2025-06-06 收录
下载链接:
https://huggingface.co/datasets/Kunalmod/so101_test_2
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个使用LeRobot创建的机器人数据集,包含50个episodes,47710帧图像,100个视频文件,专注于一个任务。数据集提供了行动、状态、手腕和底座的图像信息,以及时间戳、帧索引、剧集索引、索引和任务索引等特征。所有数据以Parquet格式存储,视频使用av1编码,适用于机器人学相关的研究和应用。
创建时间:
2025-06-04
原始信息汇总

数据集概述

基本信息

  • 许可证: apache-2.0
  • 任务类别: 机器人学 (robotics)
  • 标签: LeRobot, so101, tutorial

数据集描述

  • 主页: [More Information Needed]
  • 论文: [More Information Needed]
  • 创建工具: LeRobot

数据集结构

元数据详情

  • 代码库版本: v2.1
  • 机器人类型: so101
  • 总集数: 50
  • 总帧数: 47710
  • 总任务数: 1
  • 总视频数: 100
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 30 fps
  • 数据分割:
    • 训练集: 0:50

数据路径

  • 数据文件路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频文件路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

  1. 动作 (action)

    • 数据类型: float32
    • 形状: [6]
    • 名称:
      • main_shoulder_pan
      • main_shoulder_lift
      • main_elbow_flex
      • main_wrist_flex
      • main_wrist_roll
      • main_gripper
  2. 观测状态 (observation.state)

    • 数据类型: float32
    • 形状: [6]
    • 名称: 同动作特征
  3. 观测图像 (observation.images.wrist)

    • 数据类型: video
    • 形状: [480, 640, 3]
    • 名称: height, width, channels
    • 视频信息:
      • 高度: 480
      • 宽度: 640
      • 编解码器: av1
      • 像素格式: yuv420p
      • 非深度图
      • 帧率: 30 fps
      • 通道数: 3
      • 无音频
  4. 观测图像 (observation.images.base)

    • 同 observation.images.wrist
  5. 时间戳 (timestamp)

    • 数据类型: float32
    • 形状: [1]
  6. 帧索引 (frame_index)

    • 数据类型: int64
    • 形状: [1]
  7. 集索引 (episode_index)

    • 数据类型: int64
    • 形状: [1]
  8. 索引 (index)

    • 数据类型: int64
    • 形状: [1]
  9. 任务索引 (task_index)

    • 数据类型: int64
    • 形状: [1]

引用

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,数据集构建的精确性对算法训练至关重要。so101_test_2数据集依托LeRobot平台系统采集,通过记录so101型机械臂的50个完整操作片段,累计47710帧数据,以30fps的帧率同步捕获关节状态与视觉信息。数据以分块parquet格式存储,每块包含1000帧,确保高效存取与处理。
使用方法
研究者可通过加载parquet文件直接获取时序对齐的多模态数据流,动作空间涵盖肩部平移、抬升、肘部屈伸及腕部旋转与夹持器控制等维度。视觉数据以AV1编码视频存储,适用于行为克隆、强化学习等任务,训练集涵盖全部50个片段,可直接用于模型训练与验证。
背景与挑战
背景概述
机器人操作数据集so101_test_2由HuggingFace的LeRobot项目团队构建,专注于机器人控制与视觉感知的协同研究。该数据集采集自so101型机器人平台,包含50个完整操作序列、47,710帧多模态数据,涵盖关节动作、状态观测及双视角视觉信息。其设计旨在推动模仿学习与强化学习算法在真实物理环境中的泛化能力,为机器人自主操作任务提供标准化评估基准。
当前挑战
该数据集需解决高维连续动作空间与多模态感知的协同建模问题,其挑战包括机械臂关节控制的精确度要求、视觉观测与状态信息的时序对齐、以及真实环境中传感器噪声的鲁棒性处理。构建过程中面临多传感器数据同步、大规模视频数据压缩存储、以及操作任务多样性与数据一致性的平衡难题。
常用场景
经典使用场景
在机器人学习领域,so101_test_2数据集作为标准基准数据集,主要用于模仿学习与行为克隆算法的训练与验证。该数据集通过记录机械臂的关节状态、视觉观察与动作序列,为研究者提供了丰富的多模态交互数据,典型应用于端到端策略网络的训练过程,能够有效模拟真实环境中的机械臂操作任务。
解决学术问题
该数据集解决了机器人模仿学习中样本效率低下与泛化能力不足的核心问题。通过提供高质量的动作-状态配对数据,它支持研究者探索从视觉输入到连续动作输出的映射关系,显著促进了基于学习的机器人控制方法的发展,并为跨任务迁移与少样本学习提供了重要数据基础。
实际应用
在实际工业自动化场景中,该数据集可用于训练机械臂执行精细操作任务,如物体抓取、装配与分拣。其包含的腕部与底座视角视频数据能够模拟真实工作环境中的视觉反馈,为部署视觉伺服控制系统提供数据支持,进而提升自动化生产线的灵活性与适应性。
数据集最近研究
最新研究方向
在机器人操作学习领域,so101_test_2数据集凭借其多模态特性成为模仿学习与强化算法验证的重要基准。当前研究聚焦于利用其高维视觉观测与关节动作数据,探索端到端的策略网络架构优化,特别是在跨视角视觉特征融合与动作序列预测方面取得显著进展。该数据集推动了对真实世界操作任务中时空一致性建模的深入探讨,为具身智能系统的泛化能力评估提供了关键支撑,相关成果正逐步应用于工业自动化与家庭服务机器人的技能迁移场景。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作