five

so101-shooting-20250722

收藏
Hugging Face2025-07-22 更新2025-07-23 收录
下载链接:
https://huggingface.co/datasets/minghonlai/so101-shooting-20250722
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于机器人技术的数据集,包含80个剧集,共57452帧,1个任务,160个视频和1个片段。数据集以Apache-2.0许可证发布。数据集提供了包括动作、观测状态、手臂图像、侧面图像等多种特征信息,适用于机器人领域的研究和应用。
创建时间:
2025-07-22
原始信息汇总

数据集概述

基本信息

  • 许可证: apache-2.0
  • 任务类别: 机器人学 (robotics)
  • 标签: LeRobot
  • 代码库版本: v2.1
  • 机器人类型: so101_follower

数据集结构

  • 总集数: 80
  • 总帧数: 57452
  • 总任务数: 1
  • 总视频数: 160
  • 总块数: 1
  • 块大小: 1000
  • 帧率 (fps): 30
  • 分割: 训练集 (0:80)

数据文件路径

  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

  • 动作 (action):
    • 数据类型: float32
    • 形状: [6]
    • 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
  • 观测状态 (observation.state):
    • 数据类型: float32
    • 形状: [6]
    • 名称: 同上
  • 观测图像 (observation.images.arm):
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 视频信息: 高度480, 宽度640, 编码av1, 像素格式yuv420p, 非深度图, 帧率30, 通道3, 无音频
  • 观测图像 (observation.images.side):
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 视频信息: 同上
  • 其他特征:
    • timestamp (float32, [1])
    • frame_index (int64, [1])
    • episode_index (int64, [1])
    • index (int64, [1])
    • task_index (int64, [1])

引用信息

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作研究领域,so101-shooting-20250722数据集通过LeRobot框架系统采集,记录了80个完整任务片段,涵盖57452帧高精度时序数据。数据以分块形式存储于Parquet格式文件中,每块包含1000个连续帧,采样频率为30Hz,确保了运动轨迹的连续性与完整性。采集过程同步记录机械臂六维关节状态与双视角视觉信息,构建了多模态的机器人操作数据集。
使用方法
研究者可通过加载Parquet数据文件直接访问结构化数据,利用帧索引与时间戳对齐多模态信息。动作数据包含肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转及夹爪位置六维控制量,观测数据则对应相同维度的关节状态反馈。双视角视频流可通过指定路径加载,适用于视觉-动作联合建模任务,所有训练样本均集中于单一训练分割,支持端到端的机器人策略学习。
背景与挑战
背景概述
机器人操作数据集so101-shooting-20250722由HuggingFace的LeRobot项目团队于2024年构建,专注于机械臂控制与视觉感知的协同研究。该数据集采用SO101跟随机器人平台,通过多模态传感器采集了80个完整操作序列、57452帧高精度运动数据与双视角视觉信息,为模仿学习与强化学习算法提供了真实世界的训练基准。其核心价值在于解决了机器人操作任务中动态环境适应性与精细动作生成的难题,推动了家庭服务机器人与工业自动化领域的技术发展。
当前挑战
该数据集旨在解决机械臂动态目标抓取与轨迹规划中的高维状态空间建模问题,其挑战包括多关节协同控制的时序一致性保持、视觉-动作映射的精确对齐,以及实时决策过程中的传感器噪声抑制。构建过程中面临双视角视频数据同步校准、机械臂运动轨迹的毫米级精度标注,以及大规模多模态数据存储与高效检索的技术难题,这些挑战对机器人学习系统的可扩展性与实用性提出了更高要求。
常用场景
经典使用场景
在机器人操作学习领域,该数据集通过记录机械臂执行射击任务的多模态数据,为模仿学习算法提供标准化的训练基准。其包含的关节位置、视觉观察和时间戳信息,能够完整再现机械臂的运动轨迹与环境交互过程,成为评估动作预测模型性能的重要资源。
解决学术问题
该数据集有效解决了机器人技能迁移中的动作表征难题,通过提供精确的关节角度控制信号与同步视觉反馈,助力研究者突破动态环境下动作生成的精度瓶颈。其多模态特性为端到端模仿学习框架提供了验证基础,显著推进了复杂操作任务的算法泛化能力研究。
实际应用
工业自动化场景中,该数据集可直接应用于机械臂精准操作系统的开发,如装配线上的零件抓取与精密焊接。通过学习和复现数据集中的动作模式,机器人能够快速适应不同工件的处理需求,大幅提升生产线的灵活性与作业精度,降低人工调试成本。
数据集最近研究
最新研究方向
在机器人操作学习领域,so101-shooting-20250722数据集凭借其多视角视觉观测与高维连续动作空间的协同记录,正成为模仿学习与强化学习算法验证的重要基准。该数据集通过机械臂关节位置控制与双摄像头视觉反馈的同步采集,为跨模态表征学习提供了丰富样本。当前研究热点集中于利用此类数据开发端到端的视觉运动策略网络,特别是在少样本泛化与实时决策方面取得显著进展。随着家庭服务机器人需求的增长,该数据集对复杂场景下的物体抓取与精细操作任务具有重要推动意义,为机器人适应非结构化环境提供了关键数据支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作