five

job_assistant_12_1

收藏
Hugging Face2025-12-02 更新2025-12-03 收录
下载链接:
https://huggingface.co/datasets/wockd/job_assistant_12_1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于机器人学任务的数据集,包含101个剧集,共41734帧,通过LeRobot工具创建。数据集以parquet格式存储,并提供相应的视频文件。数据集中的特征包括机器人的动作、观测状态、两个摄像头的图像信息等,帧率为30fps。

This dataset is designed for robotics tasks, containing 101 episodes and a total of 41,734 frames, which was created via the LeRobot tool. The dataset is stored in Parquet format, with corresponding video files provided. The features included in the dataset cover robot actions, observation states, image information from two cameras, and more, with a frame rate of 30 fps.
创建时间:
2025-12-01
原始信息汇总

数据集概述

基本信息

  • 数据集名称: job_assistant_12_1
  • 托管地址: https://huggingface.co/datasets/wockd/job_assistant_12_1
  • 创建工具: 使用 LeRobot 创建
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 许可证: Apache-2.0

数据集结构

  • 配置名称: default
  • 数据文件格式: Parquet
  • 数据文件路径模式: data/*/*.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 代码库版本: v3.0
  • 机器人类型: so101_follower
  • 总任务数: 1

数据规模

  • 总情节数: 101
  • 总帧数: 41734
  • 数据块大小: 1000
  • 帧率: 30 FPS
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB

数据划分

  • 训练集: 包含所有101个情节

数据特征

  • 动作

    • 数据类型: float32
    • 形状: [6]
    • 字段名称:
      • shoulder_pan.pos
      • shoulder_lift.pos
      • elbow_flex.pos
      • wrist_flex.pos
      • wrist_roll.pos
      • gripper.pos
    • 帧率: 30 FPS
  • 观测状态

    • 数据类型: float32
    • 形状: [6]
    • 字段名称:
      • shoulder_pan.pos
      • shoulder_lift.pos
      • elbow_flex.pos
      • wrist_flex.pos
      • wrist_roll.pos
      • gripper.pos
    • 帧率: 30 FPS
  • 观测图像(相机1)

    • 数据类型: 视频
    • 形状: [480, 640, 3]
    • 维度名称:
      • 高度
      • 宽度
      • 通道数
    • 视频信息:
      • 视频高度: 480
      • 视频宽度: 640
      • 视频编解码器: av1
      • 像素格式: yuv420p
      • 是否为深度图: false
      • 视频帧率: 30 FPS
      • 视频通道数: 3
      • 包含音频: false
  • 观测图像(相机2)

    • 数据类型: 视频
    • 形状: [480, 640, 3]
    • 维度名称:
      • 高度
      • 宽度
      • 通道数
    • 视频信息:
      • 视频高度: 480
      • 视频宽度: 640
      • 视频编解码器: av1
      • 像素格式: yuv420p
      • 是否为深度图: false
      • 视频帧率: 30 FPS
      • 视频通道数: 3
      • 包含音频: false
  • 时间戳

    • 数据类型: float32
    • 形状: [1]
    • 字段名称: null
    • 帧率: 30 FPS
  • 帧索引

    • 数据类型: int64
    • 形状: [1]
    • 字段名称: null
    • 帧率: 30 FPS
  • 情节索引

    • 数据类型: int64
    • 形状: [1]
    • 字段名称: null
    • 帧率: 30 FPS
  • 索引

    • 数据类型: int64
    • 形状: [1]
    • 字段名称: null
    • 帧率: 30 FPS
  • 任务索引

    • 数据类型: int64
    • 形状: [1]
    • 字段名称: null
    • 帧率: 30 FPS

引用信息

  • 主页: 信息缺失
  • 论文: 信息缺失
  • BibTeX 引用: 信息缺失
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集是推动算法进步的关键基石。job_assistant_12_1数据集依托LeRobot开源框架构建,通过SO101型跟随机器人采集了101个完整任务片段,总计包含超过四万帧时序数据。数据以每秒30帧的速率记录,采用分块存储策略,每个数据块规模设定为1000帧,并以Parquet格式高效组织,确保了大规模机器人交互数据在存储与读取上的可行性。
特点
该数据集在结构设计上展现出鲜明的多模态特性,不仅囊括了六维关节位置的动作指令与状态观测向量,还同步提供了双视角的视觉感知流。图像数据以480x640分辨率的三通道视频形式保存,采用AV1编码压缩,在保证视觉信息完整性的同时优化了存储效率。时序索引与任务标识的精细标注,为研究者分析机器人行为的连续性及任务上下文关联提供了坚实基础。
使用方法
为便利学术探索与模型开发,数据集已预先划分为训练集,涵盖全部101个任务片段。使用者可通过LeRobot工具链或兼容的数据加载接口,依据分块路径模板灵活读取Parquet文件及其关联的视频流。在机器人模仿学习、行为克隆或视觉运动策略训练等场景中,该数据集能够直接支持端到端的模型训练与验证流程,其统一的数据范式也有利于跨研究项目的复现与比较。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的研究亟需高质量、大规模的真实世界交互数据。job_assistant_12_1数据集应运而生,由HuggingFace的LeRobot项目团队构建,旨在为机器人操作任务提供丰富的多模态演示数据。该数据集聚焦于机械臂的轨迹控制与视觉感知,通过记录六自由度机械臂的关节位置、夹爪状态及双摄像头视觉流,构建了包含101个完整交互片段、超过四万帧的时序序列。其核心研究问题在于如何利用真实环境中的示教数据,提升机器人在复杂场景下的泛化与适应能力,为端到端机器人策略学习奠定了关键的数据基础。
当前挑战
该数据集致力于解决机器人操作中的模仿学习与策略泛化挑战,其核心问题在于如何从高维视觉与动作序列中提取可迁移的技能表示。具体挑战体现在数据构建层面:多模态数据的精确同步与对齐要求极高,机械臂状态与双视角视频流需在毫秒级时间戳下保持一致性;此外,真实环境中的光照变化、遮挡及传感器噪声为数据质量带来显著干扰。数据规模的扩展亦面临瓶颈,大规模物理交互数据的采集成本高昂,且涉及复杂的硬件校准与安全约束,限制了数据集的多样性与任务覆盖范围。
常用场景
经典使用场景
在机器人学习领域,job_assistant_12_1数据集以其丰富的多模态数据,为模仿学习算法的训练提供了经典范例。该数据集收录了101个完整任务片段,涵盖机械臂关节位置、视觉图像及时间戳信息,能够模拟真实环境中的操作序列。研究者常利用这些数据训练端到端策略模型,使机器人通过观察人类演示,学习复杂抓取与放置动作,实现从感知到执行的闭环控制。
实际应用
在实际工业与服务业场景中,job_assistant_12_1数据集能够指导辅助机器人的开发与应用。基于其记录的机械臂轨迹与视觉反馈,工程师可优化生产线上的装配、分拣流程,或用于开发家庭服务机器人的物品操控能力。数据集模拟的跟随任务(follower)模式,尤其适用于人机协作环境,使机器人能自适应地配合人类操作,提升工作效率与安全性。
衍生相关工作
围绕该数据集,已衍生出一系列机器人学习领域的经典研究工作。例如,基于其多模态序列开发的时空注意力模型,增强了动作预测的准确性;亦有研究利用其进行离线强化学习算法验证,探索从历史数据中提取鲁棒策略的途径。这些工作进一步推动了模仿学习与视觉运动控制方法的创新,为开源机器人生态贡献了可复现的基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作